骨架网络(Backbone)之——空洞卷积

骨架网络(Backbone)中各种层的作用总结

空洞卷积

空洞卷积最初是为解决图像分割的问题而提出的。常见的图像分割算法通常使用池化层来增大感受野,同时也缩
小了特征图尺寸,然后再利用上采样还原图像尺寸。特征图缩小再放大的过程造成了精度上的损失,因此需要有
一种操作可以在增加感受野的同时保持特征图的尺寸不变,从而替代池化与上采样操作,在这种需求下,空洞卷
积就诞生了。
优点
空洞卷积的优点显而易见,在不引入额外参数的前提下可以任意扩大感受野,同时保持特征图的分辨率不变。
这一点在分割与检测任务中十分有用,感受野的扩大可以检测大物体,而特征图分辨率不变使得物体定位更
加精准。
缺点
* 网格效应(Gridding Effect):由于空洞卷积是一种稀疏的采样方式,当多个空洞卷积叠加时,有些像素根
本没有被利用到,会损失信息的连续性与相关性,进而影响分割、检测等要求较高的任务。

* 远距离的信息没有相关性:空洞卷积采取了稀疏的采样方式,导致远距离卷积得到的结果之间缺乏相关性,
进而影响分类的结果。

*不同尺度物体的关系:大的dilation rate对于大物体分割与检测有利,但是对于小物体则有弊无利,如何处
理好多尺度问题的检测,是空洞卷积设计的重点。
目前解决方法
典型的有图森未来提出的HDC(Hybrid Dilated Convolution)结构。该结构的设计准则是堆叠卷积的
dilation rate不能有大于1的公约数,同时将dilation rate设置为类似于[1,2,5,1,2,5]这样的锯齿类结构。此外
各dilation rate之间还需要满足一个数学公式,这样可以尽可能地覆盖所有空洞,以解决网格效应与远距离信
息的相关性问题,具体细节可参考相关资料。

猜你喜欢

转载自blog.csdn.net/m0_45388819/article/details/109729958