RFBNet目标检测算法详细总结分析(one/two-stage)(深度学习)(ECCV 2018)

版权声明:转载时,请务必注明文章出处网址,谢谢! https://blog.csdn.net/Gentleman_Qin/article/details/84403542

论文名称:《 Receptive Field Block Net for Accurate and Fast Object Detection 》

论文下载:https://arxiv.org/pdf/1711.07767.pdf

论文代码:https://github.com/ruinmessi/RFBNet


RFB-Net: RFB-Net在inception的基础上加入了dilated卷积层,增大了感受野,增强网络特征提取能力。

dilated conv不是在像素之间padding空白的像素,而是在已有的像素上,skip掉一些像素,或者输入不变,对conv的kernel参数中插一些0的weight,达到一次卷积看到的空间范围变大的目的。当然将普通的卷积stride步长设为大于1,也会达到增加感受野的效果,但是stride大于1就会导致down-sampling,图像尺寸变小。

RFB是一个类似Inception模块的多分支卷积模块,它的内部结构可分为两个组件:具有不同卷积核的多分支卷积层以及随后的膨胀卷积层。微调RFB参数主要就是调节RFB模块中卷积核kernel size以及膨胀因子rate(内核元素间的距离)。

在每个分支上,特定核大小的卷积层后面跟着一个相应膨胀系数的卷积层,最后,所有分支的feature map被连接起来,合成一个空间池化或卷积数组。(b)中,用两个3*3的卷积层代替5*5的卷积层来减少参数并深化非线性层,用一个1*n和一个n*1的卷积层来替换原始的n*n卷积层。

RFB-Net检测器利用多尺度一步检测框架SSD,在其中嵌入RFB模块,模拟人类感受野进行RFB的设计,使得轻量级主干SSD网络也能更快更准。相对较大分辨率的feature map的前卷积层被RFB模块取代。

RFB-Net检测结构:

猜你喜欢

转载自blog.csdn.net/Gentleman_Qin/article/details/84403542