YOLOv4: Optimal Speed and Accuracy of Object Detection

论文链接:https://arxiv.org/pdf/2004.10934.pdf

代码链接:https://github.com/AlexeyAB/darknet

主要思想:利用各种universal features 包括Weighted-Residual-Connections (WRC), Cross-Stage-Partial-connections (CSP), Cross mini-Batch Normalization (CmBN), Self-adversarial-training (SAT) and Mish-activatio,还有一些新的WRC, CSP, CmBN, SAT, Mish activation, Mosaic data augmentation, CmBN, DropBlock regularization, and CIoU loss等,反正就是利用了一大推的f state-of-the-art Bag-ofFreebies and Bag-of-Specials methods,堪称大型调优现场,而且这些都是作者在仅仅考虑在单gpu上面训练的时候采用的,一些多gpu有效的方法没有被采用,很具有实践参考意义。将yolov4完成了在精度上优异,速度上惊人的效果,看下图就可以看出

 文中对two-stage和one-stage的目标检测算法的结构做了很好的总结,如下图所示。

首先在网络结构上,主要是选择一些可以实时的网络结构,作者做了如下对比,相对于分类,对于检测,需要更大的输入尺寸去检测小目标,需要更多的层去获取更大的感受野,需要更多的参数去检测不同大小的目标。

最后在yolov4中选择了CSPDarknet53 backbone, SPP additional module, PANet path-aggregation neck, and YOLOv3 (anchor based) head as the architecture of YOLOv4.

 附上文中的一张图展示yolov4才用的方法

接下来就是对采用的各种方法进行实验证明有效性

首先是对 different features on Classifier training

另外展示一下对于以上数据增强的可视化效果

然后就是对于different features on Detector training的实验,如下图,其中包含很多缩写,这里就不写出来了,可以去论文自行查阅。

 最后对batchsize的大小进行了实验,发现在用了Bof和Bos之后,batchsize的影响已经不大了。after adding BoF and BoS training strategies, the mini-batch size has almost no effect on the detector’s performance

另外对于yolov4的讲解与讨论已经很多了,可以参见:

https://www.zhihu.com/question/390191723/answer/1177584901

 ,对yolov4做了不错的总结,以及这个问题下面的其他回答也不错,可以看看

猜你喜欢

转载自blog.csdn.net/breeze_blows/article/details/106417694