步骤:
1.输入照片(608,608,3)
2.经过CNN处理,输出(19,19,5,85)
3.展开以上矩阵后为(19,,19,425)
每个19*19的网格里有425个数字
425=5*85,每个网格里有5个achor box,achor box中有85个数字
85=5+80,(pc,bx,by,bw,bh,c),c有80个种类,pc代表这个box里面是否detect到object
4.通过以下方法保留少数box
Score-thredholding:丢弃识别出物体的box中score低于threshold的boxes
Non-max-suppression:计算IoU,丢弃overlap的box
5.输出YOLO的最终结果
注:重新开始初始化w开始计算YOLO模型,计算量非常大。因此可以直接引用训练好的模型。