目标检测算法分类及相关术语

1.目标检测算法分类:

Two stage:

1)先生成Region Proposal,
2)通过卷积神经网络进行分类。
步骤:特征提取 ——> 生成Region Proposal ——> 分类/回归
代表算法:R-CNN、 Spp-Net、Fast R-CNN、Faster-RCNN,MTCNN等。

One stage

1)直接提取特征来预测物体的类别和位置。
步骤:特征提取 ——> 分类/回归
代表算法: YOLOv1、v2、 v3, SSD, RetinaNet等

2.相关术语

  1. bounding box:给出物体在图片中的定位区域 一般表示为: (x1,y1,w,h) , 其中(x1,y1) 为左上角的点。一般分为待预测的框和已经标定的框,其中已经标定的框称为ground truth。
  2. loU (Intersection of Union): 两个bounding box的重叠程度= (A交B) / (A并 B),用于评价算法测的结果和真实结果(人工标注的ground truth)的差别,范围[0,1], 交并比越大,两个包围盒的重叠程度越高。有几种iou的算法,可百度一下。
  3. nms(非极大值抑制):通过计算iou,从一堆候选框中去掉重复的候选框。(注意这里是非极大值抑制而非最大值抑制,原因在于多目标检测时的多堆候选框)
  4. mAP (mean average precision): 当预测的框和真实框的交并比大于某-一阈值(通常为0.5), 则认为该预测正确。对每个类别,我们画出它的查准率.查全率(precision-recall)曲线,平均准确率是曲线下的面积。之后再对所有类别的平均准确率求平均,即可得到mAP,其取值为[0, 100%]。
  5. Regional Proposal(RPN): 候迭区域。指提取出所有可能包含识別目标的一些候迭区域,相比于传统的候选区域而言,Regional Proposal数量上会更少(通常1K~2K个) ,质量更高。
  6. Anchor Box : 候选框, 从原始或卷积后的图片中提取出来,然后用来判断是否存在待识別目标的小的图片块。
  7. Selective Search (选择性搜索):,利用颜色、纹理、尺寸、空囘交叠来生成候迭区域的算法,相比于传统的滑动窗口算法,Selective Search避免了暴力穷举所产生的海量的候选区域导致的低效率。

参考:https://space.bilibili.com/144446101/

发布了61 篇原创文章 · 获赞 17 · 访问量 2966

猜你喜欢

转载自blog.csdn.net/qq_35027690/article/details/103906531