YOLO论文学习笔记







方法:将图像划分为网格,在每个网格中预测物体边框

YOLO,因为最后采用的是全连接层,每个物体边框的预测都已整张图的特征为输入,换言之当我们在判断一个位置上是否有物体,以及这个物体的大小和位置时,都是看了整张图上的所有特征,这个好处就在于我有足够多的上下文信息能够辅助判断,因此YOLO在检测中有一个很大的优势-->在背景上的误检会非常少,下图红色可以看到Fast R-CNN在背景上的误检为13.6%,YOLO只有4.75%


YOLO速度和精度

速度快,精度慢

7*7的网格划分是比较粗糙的,当物体过小的时候,很可能就检测不到,且最多只能检测49个物体,所以对密集排布的物体也存在问题,比如数量超过了49,或者多个物体在一个网格内;同时检测框的准确性也是一个问题,可以关注一下下图中的蓝色的区域,该区域表示的是,检测出了一个物体,但该物体的框非常的不准,所以只能认为是误检。



猜你喜欢

转载自blog.csdn.net/weixin_39881922/article/details/80509819