yolov3代码解读（2）

######  kmeans.py   #####


import numpy as np  #numpy是矩阵计算的函数库


class YOLO_Kmeans:

    def __init__(self, cluster_number, filename):   ###__init__()  是python中类的构造函数  ，其他为普通成员函数
        self.cluster_number = cluster_number       ###其实self就有点类似c++中的this指针指向的该实例化对象本身
        self.filename = "2012_train.txt"

    def iou(self, boxes, clusters):  # 1 box -> k clusters   ##求取每个数据与k个中心点的iou值  返回值result是[boxes.size(),k]
        n = boxes.shape[0]
        k = self.cluster_number

        box_area = boxes[:, 0] * boxes[:, 1]
        box_area = box_area.repeat(k)
        box_area = np.reshape(box_area, (n, k))

        cluster_area = clusters[:, 0] * clusters[:, 1]
        cluster_area = np.tile(cluster_area, [1, n])
        cluster_area = np.reshape(cluster_area, (n, k))

        box_w_matrix = np.reshape(boxes[:, 0].repeat(k), (n, k))
        cluster_w_matrix = np.reshape(np.tile(clusters[:, 0], (1, n)), (n, k))
        min_w_matrix = np.minimum(cluster_w_matrix, box_w_matrix)

        box_h_matrix = np.reshape(boxes[:, 1].repeat(k), (n, k))
        cluster_h_matrix = np.reshape(np.tile(clusters[:, 1], (1, n)), (n, k))
        min_h_matrix = np.minimum(cluster_h_matrix, box_h_matrix)
        inter_area = np.multiply(min_w_matrix, min_h_matrix)

        result = inter_area / (box_area + cluster_area - inter_area)
        return result

    def avg_iou(self, boxes, clusters):    ###mean函数为取平均值函数
        accuracy = np.mean([np.max(self.iou(boxes, clusters), axis=1)])  ###取每个box与其计算有最大的iou的值，计算所有最大的iou的值的平均值
        return accuracy

    def kmeans(self, boxes, k, dist=np.median):  ##dist为传入kmeans函数的函数，np.median函数是返回数组元素中沿指定轴的元素（函数内部要调用这个函数）
        box_number = boxes.shape[0]  ###返回boxes数组的纵向维度，即数据中总共有多少个框
        ## 创建一个没有任何具体值的数组
        distances = np.empty((box_number,k))                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     
        last_nearest = np.zeros((box_number,))  ##创建一个全0的数组
        np.random.seed()
	## np.random.choice(a,size=None,replace=true,p=None)  从a中随机选取size个元素组成数组，replace为true表示可以重复选择，为false表示不可以重复选元素，p为数组，与a相对应，表示取a中每个元素的概率大小，默认选取每个元素的概率相同
        clusters = boxes[np.random.choice(   
            box_number, k, replace=False)]  # init k clusters  初始化k个中心点
        while True:

            distances = 1 - self.iou(boxes, clusters)    ##计算9个随机中心值与所有数据的iou值

            current_nearest = np.argmin(distances, axis=1)   ##选取iou值最小的的点，current_nearest数组中存的是每个点距离其最近的中心点的编号  （横轴为axis=1）
            if (last_nearest == current_nearest).all():
                break  # clusters won't change
            for cluster in range(k):
                clusters[cluster] = dist(  # update clusters
                    boxes[current_nearest == cluster], axis=0)   ## 取分到cluster组的元素的中值（这里boxes和current_nearest是大小相等的 ，里面元素一一对应的，再此 boxes[current_nearest==cluster] 是取boxes中元素对应的current_nearest中的元素与当前的cluster值相等的 boxes中的元素组成的数组 ，并利用dist函数取数组额中值，更新中心值数组clusters）

            last_nearest = current_nearest

        return clusters

    def result2txt(self, data):   ###把选出的9个中心值anchors 大小信息写入yolo_anchors.txt 文件中
        f = open("yolo_anchors.txt", 'w')
        row = np.shape(data)[0]
        for i in range(row):
            if i == 0:
                x_y = "%d,%d" % (data[i][0], data[i][1])
            else:
                x_y = ", %d,%d" % (data[i][0], data[i][1])
            f.write(x_y)
        f.close()

    def txt2boxes(self):     ###打开filename文件 ，读取框的宽和高存入指定数据结构中
        f = open(self.filename, 'r')   ###只读方式打开名字为filename的文件，返回并创建一个file对象
        dataSet = []    ###定义一个列表
        for line in f:  ###通过迭代器访问文件中的内容
            infos = line.split(" ")   ###该函数是将一个字符串分裂成多个字符串组成的列表，这里以参数“  ”进行分割
            length = len(infos)
            for i in range(1, length):    #infors中的数据应该是这种格式[1,2,100,110] ,前两个数是数据框左上角坐标x，y，后两个数是数据框右下角坐标x，y
                width = int(infos[i].split(",")[2]) - \
                    int(infos[i].split(",")[0])
                height = int(infos[i].split(",")[3]) - \
                    int(infos[i].split(",")[1])
                dataSet.append([width, height])  ###append向列表末尾添加新的对象
        result = np.array(dataSet)  ###利用dataset列表创建一个二维数组result   （这里列表是python的固有数据结构）
        f.close()
        return result

    def txt2clusters(self):
        all_boxes = self.txt2boxes()
        result = self.kmeans(all_boxes, k=self.cluster_number)
        result = result[np.lexsort(result.T[0, None])]  ##对9个中心值进行排序
        self.result2txt(result)
        print("K anchors:\n {}".format(result))
        print("Accuracy: {:.2f}%".format(
            self.avg_iou(all_boxes, result) * 100))


if __name__ == "__main__":     ###__name__ 是标识模块的名字的一个系统变量 
    cluster_number = 9
    filename = "2012_train.txt"
    kmeans = YOLO_Kmeans(cluster_number, filename)   ##创建一个YOLO_Kmeans类的实例kmeans（也就是对象）
    kmeans.txt2clusters()
yolov3代码解读（2）

猜你喜欢