目标检测算法分类及相关术语

1.目标检测算法分类：

Two stage：

1）先生成Region Proposal，
2）通过卷积神经网络进行分类。
步骤：特征提取 ——> 生成Region Proposal ——> 分类/回归
代表算法：R-CNN、 Spp-Net、Fast R-CNN、Faster-RCNN，MTCNN等。

One stage

1）直接提取特征来预测物体的类别和位置。
步骤：特征提取 ——> 分类/回归
代表算法: YOLOv1、v2、 v3, SSD, RetinaNet等

2.相关术语

bounding box：给出物体在图片中的定位区域一般表示为: (x1,y1,w,h) , 其中(x1,y1) 为左上角的点。一般分为待预测的框和已经标定的框，其中已经标定的框称为ground truth。
loU (Intersection of Union)： 两个bounding box的重叠程度= (A交B) / (A并 B)，用于评价算法测的结果和真实结果(人工标注的ground truth)的差别，范围[0,1]，交并比越大，两个包围盒的重叠程度越高。有几种iou的算法，可百度一下。
nms(非极大值抑制)：通过计算iou，从一堆候选框中去掉重复的候选框。（注意这里是非极大值抑制而非最大值抑制，原因在于多目标检测时的多堆候选框）
mAP (mean average precision)： 当预测的框和真实框的交并比大于某-一阈值(通常为0.5)，则认为该预测正确。对每个类别，我们画出它的查准率.查全率(precision-recall)曲线，平均准确率是曲线下的面积。之后再对所有类别的平均准确率求平均，即可得到mAP,其取值为[0, 100%]。
Regional Proposal(RPN)： 候迭区域。指提取出所有可能包含识別目标的一些候迭区域，相比于传统的候选区域而言，Regional Proposal数量上会更少(通常1K~2K个) ,质量更高。
Anchor Box ： 候选框，从原始或卷积后的图片中提取出来，然后用来判断是否存在待识別目标的小的图片块。
Selective Search (选择性搜索)：，利用颜色、纹理、尺寸、空囘交叠来生成候迭区域的算法，相比于传统的滑动窗口算法，Selective Search避免了暴力穷举所产生的海量的候选区域导致的低效率。

参考：https://space.bilibili.com/144446101/

小研一枚

发布了61 篇原创文章 · 获赞 17 · 访问量 2966

私信关注

目标检测算法分类及相关术语

1.目标检测算法分类：

Two stage：

One stage

2.相关术语

猜你喜欢