深度学习【二】RCNN、Faste rcnn、Faster rcnn

RCNN 

(1)selective search 算法 选择出可能包含目标的目标框,如下,但是找到的目标不一定都是需要的目标,而且在CPU上跑


(2)对于每个可能的候选框分别卷积,提取特征(因为分类和回归任务全连接层不一样的话,不同尺寸的特征图不能做)

(3)然后对每个特征图做了分类和回归任务



针对RCNN中每个卷积不能共享(全连接层必须尺寸一样的特征图)提出了Faste rcnn

(1)整个图像做了一个全卷积,得到特征图

(2)将图像中可能存在目标的区域(这个还是用selective search算法得到)映射到特征图中(感受野),ROIs

(3)做了ROI Pooling,将特征图比较大的区域框,提取更多的,特征图比较小的区域框,提取小的,然后拼接成同一大小的特征图

(4)将这个特征图连接到全连接层作分类和回归任务

ROI pooling:

 

Faster rcnn:


(1)整张图像进行卷积得到特征图

(2)对特征图进行RPN操作,得到可能是目标区域的候选框(相对于原始图像的候选框),代替了selective search算法

(3)将这个候选框映射到(1)中得到的特征图上

(4)进行分类和回归

 详细过程如下:



猜你喜欢

转载自blog.csdn.net/j497205974/article/details/80140917
今日推荐