只是自己的学习记录,论文提炼
摘要
- 在RCNN的基础上提出的。两个改进的优点:更快更准确。
- Fast RCNN用VGG16网络,训练集比RCNN快9倍,测试集快213倍。
介绍
-
目标检测有巨大挑战——需要精确定位目标:生成候选框;修正候选框。这样些问题势必会影响速度、准确性、简洁性。
-
RCNN的缺点:muti-stage、训练耗费时间空间、检测慢
-
SPPnet的缺点:muti-stage,不能更新池化之前的卷积层导致不准确
-
Fast RCNN优点:mAP高;single-stage;能更新所有网络层;无需磁盘缓存特征。
-
具体操作步骤:整张图片输入卷积神经网络->RoI池化->全连接层->特征向量->softmax和bbox(4个边界框值)
-
RoI池化层:将特征图转换成固定大小(7×7)。
-
预训练网络初始化:用三个ImageNet,每个有5个最大池化层和5~13个卷积层。
-
网络有三处改变:
(1)RoI最大池化取代最后一个最大池化
(2)softmax和回归器双分支取代最后一个全连接及softmax层
(3)输入有两个:图像和图像的RoI。