Fast-Rcnn 核心思想:简化Rcnn中计算的复杂度
针对RCNN的缺点
网络结构:
输入图片直接输入到卷积神经网络中得到特征图(而不是RCNN中先进行区域选择),在特征图中使用Slective search(RCNN是直接使用对原图选择区域)提出若干候选区域进行共享,提出候选区域大小形状可能不同,原本的Rcnn候选区域需要进行Warped 缩放到相同的大小(缩放会丢失某些图像特征),会有信息的损失,在fast-Rcnn中用rol pooling代替warp
同样在分类中,使用softmax+regressor代替svm+regressor实现分类和回归的联合训练
训练速度和预测速度提高,但是Slective search仍然占用的时间偏多faster-RCNN 使用RPN代替 Slective search
三个改进:
- 直接将图片输入到CNN中提取特征,对特征图使用Slective search得到候选区进行共享
- 使用Rol Pooling进行缩放
- 使用softmax+regressor