Squeeze-and-Excitation Networks 的理解 - 代码天地

Squeeze-and-Excitation Networks 的理解

编程语言 2018-05-28 07:34:56 阅读次数: 1

SE-Block 主要是考虑到了不同通道之间所占的重要性可能不一样，而以前的网络中并没有考虑到这一点，而是把所有通道的重要性当成一样来处理的。

不同的通道的重要性是通过学到的一组权值来scale的，相当于经过加入权值进来之后，对原来的feature的一个重新的标定，具体的结构如下：

相当于先将input（h*w*c）沿着size方向经过Squeeze操作变成(1*1*c)的，

然后再经过Excitation这一步学到一个权重W，

最后根据学到的权重W 再经过scale操作变成（h*w*c）的output, 可以看出，input

和Output的shape是一样的，但是每个位置上的值却是经过重新标定的，实际上直观地看这个网络BLOCK 应该会提升性能，因为假设W是identity那么就是原来的情况，这里的思想个人感觉有点像Resduial里的想法，就是有一条路可以保证不变，然后另外一条路多少可以学到一些，所以得到的网络是有提升的，不过Resduial里面还有其他优点，比如可以避免因为网络过深而带来的梯度消失问题。

下面举例说明具体的情况。

左图是Inception中添加了SE-block之后的结构，右图是Residual添加了SE-block之后的结构，框右下角的数字是输出的shape,个人觉得之所以以这两个网络为例说明是因为目前一般会在网络的深度上和宽度上对网络进行设计，而这两个刚好是代表。

从Inception输出之后的shape是c * h*w,

step1. 沿着size的方向作Global average pooling, 出来的shape 是c*1*1,

step2.经过一个FC层，出来的是（c/16, 1, 1），注意可以不是16，然后经过Relu,

然后再经过一个FC层，再经过一个Sigmoid 层，output的shape是（c, 1, 1）这里没有注意顺序。这一步做完之后出来了c个weight,

step3. 根据上面得到的c个weight，分别scale之后作为最终的输出，这里的scale的意思是比如得到的是（0.1，0.2，0.7）那么就在对应的通道上乘上对应的weight.

欢迎指正！多谢！

猜你喜欢

转载自blog.csdn.net/qfpkzheng/article/details/80383717

Squeeze-and-Excitation Networks 的理解

[论文理解] Squeeze-and-Excitation Networks

Squeeze-and-Excitation Networks

《Squeeze-and-Excitation Networks》

《Squeeze-and-Excitation Networks（SENet）》

Squeeze-and-Excitation Networks（译）

SENet：Squeeze-and-Excitation Networks

SENet（Squeeze-and-Excitation Networks）算法笔记

Squeeze-and-Excitation Networks SE-net

Squeeze-and-Excitation Networks 解析（转）

解读Squeeze-and-Excitation Networks（SENet）

SENet：Squeeze-and-Excitation Networks详解

《Squeeze-and-Excitation Networks》论文笔记

SENet(Squeeze-and-Excitation Networks)论文详解

(Classification) Review: Squeeze-and-Excitation Networks

【论文阅读笔记】Squeeze-and-Excitation Networks

SENet（Squeeze-and-Excitation Networks）详解

Squeeze-and-Excitation Networks阅读笔记一

机器学习论文笔记（五）：Squeeze-and-Excitation Networks

论文阅读笔记：SENet: Squeeze-and-Excitation Networks

【CVPR2018】Squeeze-and-Excitation Networks (SEnet)

论文笔记（3）：Squeeze-and-Excitation Networks

SE-Net Squeeze-and-Excitation Networks 压缩并激活

【SENet 解读】通道注意力：Squeeze-and-Excitation Networks

注意力机制——Squeeze-and-Excitation Networks（SENet）

2018 CVPR 《Squeeze-and-Excitation Networks》 PyTorch实现

卷积神经网络的理解 Squeeze-and-Excitation (SE)网络

注意力机制论文:Squeeze-and-Excitation Networks及其PyTorch实现

注意力之channel 注意力机制Squeeze-and-Excitation Networks

Concurrent Spatial and Channel ‘Squeeze & Excitation’ in Fully Convolutional Networks(附代码)

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)