[深度学习]Object detection物体检测之YOLO v1(6)

目录

与以往rcnn,SPPNet,fast rcnn,faster rcnn的不同

YOLO的特点

YOLO的流程

YOLO的网络结构图

YOLO的loss function

YOLO的局限

YOLO的实验结果


论文全称:《You Only Look Once: Unified, Real-Time Object Detection》

论文地址:https://arxiv.org/pdf/1506.02640.pdf

之前介绍的rcnn,SPPNet,fast rcnn,faster rcnn都是属于two stage的物体检测算法,包括了区域提取和目标检测。从这一篇开始,是one stage的算法,它是一种end-to-end的算法,在确保精度保持基本不变的前提下可以大大提高检测的速度。

与以往rcnn,SPPNet,fast rcnn,faster rcnn的不同

  1. YOLO是一个回归问题,只要输入一张图片便可完整得到检测框和分类的类别,以及属于该类别的置信度。而rcnn/fast rcnn/faster rcnn将检测结果分为两部分求解:物体类别(分类问题),物体位置即bounding box(回归问题)。
  2. YOLO把region proposal和classification都集成在一个网络之中,没有一个显式的region proposal的过程。因此YOLO可以直接从检测性能上进行端到端优化。而rcnn SPPNet fast rcnn是属于两个模块的组合(使用selective search挑选候选框),faster rcnn是利用RPN(region proposal network)代替了selective search,但是要不断来回训练RPN和分类的网络,因为他们共享卷积参数

YOLO的特点

  1. 统一架构使得检测速度非常快,能够达到实时的要求。在 Titan X 的 GPU 上 能够达到 45 帧每秒。YOLO的一个小版本Fast YOLO处理了速度达到惊人的155帧每秒,同时仍然达到了其他实时探测器mAP的两倍。
  2. YOLO产生更多的定位错误,背景错误(把背景错认为物体)比较少
  3. 泛化能力强。YOLO学习了对象的一般表示。在将自然图像推广到其他领域(如艺术品)时,它优于其他检测方法,包括DPM和R-CNN。
  4. YOLO v1在精确度上仍落后于最先进的检测系统。虽然它可以快速识别图像中的对象,但它很难精确定位某些对象,尤其是小对象。

YOLO的流程

  1. 对输入的图像resize
  2. 卷积神经网络提取特征
  3. 根据置信度使用非最大值抑制取出部分候选框

YOLO将一张image分成S*S个格子,。每一个格子预测B个bounding  boxes的位置坐标,以及他们的置信度和分类的概率。

这些置信度得分反映了模型对框中包含对象的信心程度,以及它认为框所预测的准确性。下面就是置信度的公式:

如果格中不存在对象,那么confidence应该为零。否则,我们希望confidence等于预测框和ground truth之间的交集(IOU)。

每个边界框由5个预测组成:x、y、w、h和confidence。(x, y)坐标表示框的中心相对于网格单元的边界。宽度和高度是相对于整个图像进行预测的。最后,confidence预测表示预测框与任何ground truth之间的IOU。

每个格还预测C条件类的概率,。每个格有一组类概率,不管bounding boxes的数量是多少。

在测试时,将条件类的概率和单个bounding box的置信度预测相乘,

这样不仅反映每个bounding box是否含有object,还反映了object属于那种类别的概率。

YOLO的网络结构图

YOLO的loss function

损失函数的设计目标就是让坐标(x,y,w,h),confidence,classification 这个三个方面达到很好的平衡。

图

YOLO的局限

  1. YOLO对边界框预测施加了强烈的空间约束,因为每个网格单元格只能预测两个框,并且只能有一个类。这种空间约束限制了模型能够预测相邻对象的数量。模型在处理以群体形式出现的小物体时遇到了困难,比如成群的鸟。
  2. 由于YOLO是从数据中学会预测边界框,所以它很难推广到新的或不常见的纵横比或配置对象。模型还使用了相对粗糙的特性来预测边框,因为YOLO的架构有多个从输入图像向下采样的层(卷积层)。
  3. 损失函数对待小bounding boxes和大bounding boxes中的错误是一样的。大bounding box里的小错误通常是良性的,但小bounding box里的小错误对IOU的影响要大得多。

YOLO的实验结果

参考:

https://zhuanlan.zhihu.com/p/24916786?utm_source=qq&utm_medium=social

https://zhuanlan.zhihu.com/p/25236464

猜你喜欢

转载自blog.csdn.net/sinat_33487968/article/details/83959361