【深度学习】目标检测网络结构SPP FAST-RCNN FASTER-RCNN

在讲fast-rcnn之前,我们先来看一下spp net吧?~

spp net对r-cnn的改进主要有两点:

        1. 只对原图提取一次特征。输入是图片,在feature层对应位置找到候选框的位置。

        2. 结合空间金字塔方法实现cnns的对不同尺度的输入。实现数据的多尺度输入。分别划分不同的小块对feature进行pooling。

对比r-cnn提速100倍左右

问题:如何训练提取特征的网络?

流程:选框,CNN,SVM,回归

fast rcnn:

解决的问题:输入很多图重复计算耗时。

解决办法:借鉴spp net的思想,1. 图片过一次网络,在特征层选框;2. 提出roi pooling,将候选框划分为2*2的区域,提取特征,保证所有候选框提取的特征都是一致的。

流程改动:没有SVM,roi pooling后边直接接分类和回归分支

faster rcnn:

解决的问题:选择性搜索,找出所有候选框也非常耗时。

解决办法:使用region proposal network(rpn)-->提取边缘的神经网络。

具体做法:将rpn放在最后一个卷积层的后面。rpn直接训练得到候选区域。

rpn具体算法详解:https://www.cnblogs.com/wangyong/p/8513563.html

非极大值抑制算法详解:https://blog.csdn.net/zchang81/article/details/70211851

流程改动:加RPN在特征层选框,最终确定大约300个概率较高的框继续向后做ROI POOLING等,NMS移到网络最后决定300个框留下哪几个

猜你喜欢

转载自blog.csdn.net/Sun7_She/article/details/90299702
今日推荐