SENet:Squeeze-and-Excitation Networks详解

这篇论文在2017年由Momenta 自动驾驶AI公司和斯坦福大学团队提出。

一、摘要

     卷积神经网络通过在局部感受野上进行卷积操作来融合空间和通道信息提取信息的特征。为了增加网络的表达的能力,最近的方法比如增加稀疏编码获得了不错的效果。在本文中,作者关注通道之间的关系并且提出了一个新颖的结构单元"squeeze-and-excitation" 简称SE模块。这个SE模块通过准确的对通道之间的相互关系进行建模并自适应的重新校正各通道特征的响应。作者证明了通过将SE模块叠加一起在挑战赛数据集中测试,最终在增加少量的计算代价前提下,为当前最先进的深度框架带了显著的提升。

二、介绍

     最近的研究工作证实了网络的性能可以通过“embedding learning mechanism(嵌入学习机制),在没有监督的情况下获取空间相关性。其中一个比较流行的方法是Inception architectures,网络框架通过嵌入多尺度处理取得了不错的准确率。最近更多的工作里力求获得更好的空间依赖性以及空间注意力。文章中作者通过分析各种不同方面的关于通道联系之间的框架,由此介绍了一个新的框架单元叫作SE模块。通过准确的塑造卷积特征图的通道间的联系使网络的表达能力得以提升。作者提出了一个机制,可以自主学习全局的信息去选择有用的特征,抑制无用的特征。

三、squeeze-excitation模块

    1、squeeze:为了解决如何利用通道直接的依赖关系问题,在输出的特征图中,我们首先以每一个通道去考虑。在局部感受野中每一个学习到的滤波器操作不能利用除此之外的区域的上下文信息。由于感受野太小,在底层特征中这个问题比较严重。为了缓解这个问题,作者提出采用全局平均池化的策略将全局空间信息挤成一个通道的描述符。具体公式如下:

也就是说将每一个通道的全局信息通过全局平均池化的方法变成一个数,这个数用来描述代表这个通道,也就是整个图像。除了采用全局平均池化的策略外也可以采用其他复杂的聚合策略来描述这个通道。

 2、Excitation:为了充分利用前一阶段的通道聚合信息,excitation操作力求获取各通道信息的依赖关系。首先excitation操作必须满足两个特点:1他必须很泛化很灵活,得具备各通道之间融合的非线性;2他必须学习一个非互斥关系。excition操作包括两个全连接层两个激活层操作。为了限制模型的复杂性以及提升模型的性能,作者通过一个瓶颈层(1x1卷积)以及激活激活函数,最后输出为每个通道的数值为[0,1], 这些值也就是每个通道的权重系数。即实现了利用有用的通道抑制无用的通道。再讲这些这些权重参数与输入的通道信息进行相乘,即得到新的通道信息,作为下一部分的输入使用,具体公式介绍如下:

扫描二维码关注公众号,回复: 4113633 查看本文章

其整体SENet框架图如下:

最后经过输出,得到不同颜色的通道特征图,表示其通道不同的权重。

四、思考

   1、squeeze操作采用全局平均池化是否换成其他的方式,更能代表这个通道的信息。

   

猜你喜欢

转载自blog.csdn.net/lyl771857509/article/details/82662159