【物体检测】物体检测相关与RCNN系列

现在开始讨论物体检测。

还是从博客及论文开始大量学习。

1.https://www.cnblogs.com/love6tao/p/7351952.html《一篇文章看懂物体检测的发展脉络》

计算机视觉：

第一个层次是图像分类、物体检测、语义分割

第二个层次是3D重建

第三个层次是视觉问答

物体检测典型思路：确定目标位置+置信度分类

确定目标位置方法：

滑动窗口穷举遍历；启发式方法，region proposal method，如Selective Search

置信度分类：

图像模板匹配，计算相关性；

事先知道三维形状，进行匹配；

图像特征表达，欧氏距离匹配；

SIFT\HOG\LBP特征+SVM等分类器；

DPM：Pictorial Structure（弹簧模型，允许部件位置上的一定程度的不同）+HOG dectector

深度学习CNN提取特征然后分类{

R-CNN 系列：先产生region proposal，然后再去分类和回归。

SSD YOLO：一步到位

}

用CNN去解决检测问题的思路，基本就是这几个套路。其实还有一个方向我们并没有讨论，就是用神经网络去学习怎么做检测的后处理，例如非极大抑制（Non-Maximum Suppression）等。这类工作关注的人相对比较少，所以相关的工作也不多。不过在上面介绍的几个基本框架下，可以研究的细节还有很多，例如怎样去处理好物体的尺度问题，物体的形变问题，怎样用多任务学习来提高物体检测的性能，怎样去最好context和detail之前的平衡等等，我们就不在此做详细讨论了。

在物体检测领域，对细节的处理直接影响到模型最终的结果

2. https://www.cnblogs.com/sddai/p/5696870.html 《准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure》

精确率就是有没有误检的，如果有，正确的占比多大

召回率就是有没有漏检的，如果有，检测出来的占比多大

注意理解 TP FP

【物体检测】物体检测相关与RCNN系列

猜你喜欢