目标检测-RCNN家族

	基于深度学习的目标检测RCNN家族

一、 R-CNN
R-CNN系列论文(R-CNN,fast-RCNN,faster-RCNN)是使用深度学习进行物体检测的鼻祖论文,其中fast-RCNN 以及faster-RCNN都是沿袭R-CNN的思路。
R-CNN全称region with CNN features,其实它的名字就是一个很好的解释。用CNN提取出Region Proposals中的featues,然后进行SVM分类与bbox的回归。
二、 R-CNN的整体流程
在这里插入图片描述

RCNN的流程:

(1) 先对图像进行图像分割,分割成2k个图像区域。
(2) 预训练一个图像分类的CNN网络
(3) 将切割的区域图像,通过预训练的CNN网络进行特征提取,不进行CNN网络的全连接层,只对图像做特征提取
(4) 对特征提取的图像建立对应SVM分类器,将图像特征输入,进行分类。
(5) 将特征提取的图像,传入到定位模型网络总,定位出区域内的目标中心位置和宽高,训练该网络
在这里插入图片描述

(1) Selective Search 工作原理:

在这里插入图片描述

在这里插入图片描述

(2) Bounding Box Regression(边界框回归):
在这里插入图片描述

损失函数:
在这里插入图片描述

(3) R-CNN 架构图
在这里插入图片描述

(4) :R-CNN的计算瓶颈
在这里插入图片描述

三、 Fast R-CNN
在这里插入图片描述

(1) Fast R-CNN 架构图

在这里插入图片描述
在这里插入图片描述

	可以看出Fast RCNN主要有3个改进:

1、 卷积不再是对每个region proposal进行,而是直接对整张图像,这样减少了很多重复计算。原来RCNN是对每个region proposal分别做卷积,因为一张图像中有2000左右的region proposal,肯定相互之间的重叠率很高,因此产生重复计算。
2、 用ROI pooling进行特征的尺寸变换,因为全连接层的输入要求尺寸大小一样,因此不能直接把region proposal作为输入。
3、 将regressor放进网络一起训练,每个类别对应一个regressor,同时用softmax代替原来的SVM分类器。

(2) ROI pooling
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

(3) 损失函数

在这里插入图片描述

(4) 总结
在这里插入图片描述

四、 Faster R-CNN

在这里插入图片描述

Region Proposal Network(RPN):

在这里插入图片描述

即区域候选网络,该网络替代了之前RCNN版本的Selective Search,用于生成候选框。这里任务有两部分,一个是分类:判断所有预设anchor是属于positive还是negative(即anchor内是否有目标,二分类);还有一个bounding box regression:修正anchors得到较为准确的proposals。因此,RPN网络相当于提前做了一部分检测,即判断是否有目标(具体什么类别这里不判),以及修正anchor使框的更准一些。
(1) 训练步骤
在这里插入图片描述

(2) 损失函数
在这里插入图片描述

(3) 总结

在这里插入图片描述

五、 RCNN家族总结示意图

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_43391596/article/details/127999981