Squeeze-and excitation network - 代码天地

Squeeze-and excitation network

其他 2020-04-05 21:30:03 阅读次数: 0

Squeeze-and excitation network

introdutcion

motivation：当前一些研究表明，将attention机制引入网络中来捕获特征之间的空间相关性可增强CNN的表征，但本文希望建立channels之间的关系。

整体的SE block的图：

如上图所示：变换函数Ftr将输入x转化为特征U，U的shape为h*w*c。随后U经两个分支，在上面的分支中，U先经squeeze operation,产生通道级描述（a channel descriptor），再经an excitation operation，对每个通道产生权重。最后将产生的权重与下面分支出来的特征U相乘，得到SE block的输出。

实验数据集：imagenet

squeeze-and-excitation blocks

1.得到指定维度的输出U

Ftr：将输入X转换为shape=H*W*C的特征图U, Ftr定义为卷积操作。（对应到resnet中这一部分可以理解为一系列的卷积+激活+bn操作，目的是得到变化后的特征U）

2.squeeze操作

目的：获取channel dependencies。squeeze这里执行了global average pooling，从而将h和w维度置为1，来得到C维向量z，z中每一个值：

3.excitation操作

目的：fully capture channel-wise dependencies。

这里 δ是relu，增加非线性。W1的shape=C/r *c，W2的shape= C * C/r，可以理解为先对通道降维再升维，来减少参数计算。这里选用了两个FC层，具体就是a dimensionality-reduction（第一个fc） --relu （激活）-- a dimensionality-increasing layer（第二个fc）+sigmoid层（得到0-1间的分数），最终输出原channel维度大小的向量。

看代码发现，squeeze和exctitation都很简单啊～上代码：

这里的avg_pool对应squeeze操作，fc对应excitation操作，两步操作后得到的输出与原始输入的shape相同。

4.计算final output

5.将SE block引入到主流模型中

我们构建了SE-inception network和SE-resnet module

experiment

1.是否加SE block的对比

2.在imagenet上与state-of-the-art对比

个人想法：

1）resnet中，具体的se-layer是接在每个block中，最后一个bn层后面

2）在ucf101上测试过se，效果并不明显。一开始使用se时反而会掉点，后来过了段时间把se的每个通道权重打出来看了下，发现完全分布在0.5附近，且差异非常小。

karen17

发布了56 篇原创文章 · 获赞 7 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/karen17/article/details/95937121

Squeeze-and excitation network

「Deep Learning」Notes on Squeeze-and-Excitation Network (SENet)

SENet（Squeeze-and-Excitation Network）注意力机制

Squeeze-and-Excitation Networks

SE （Squeeze Excitation）模块

《Squeeze-and-Excitation Networks》

抓取检测论文笔记, 用于抓取的Residual Squeeze-and-Excitation Network

Squeeze-and-Excitation Networks 的理解

《Squeeze-and-Excitation Networks（SENet）》

Squeeze-and-Excitation Networks（译）

SENet：Squeeze-and-Excitation Networks

25FPS实时图像去雨算法RSEN | Residual Squeeze-and-Excitation Network for Fast Image Deraining

SENet（Squeeze-and-Excitation Networks）算法笔记

Squeeze-and-Excitation Networks SE-net

Squeeze-and-Excitation Networks 解析（转）

Squeeze Excitation Module 对网络的改进分析

解读Squeeze-and-Excitation Networks（SENet）

SENet：Squeeze-and-Excitation Networks详解

《Squeeze-and-Excitation Networks》论文笔记

SENet(Squeeze-and-Excitation Networks)论文详解

[论文理解] Squeeze-and-Excitation Networks

(Classification) Review: Squeeze-and-Excitation Networks

【论文阅读笔记】Squeeze-and-Excitation Networks

SENet（Squeeze-and-Excitation Networks）详解

Squeeze-and-Excitation Networks阅读笔记一

机器学习论文笔记（五）：Squeeze-and-Excitation Networks

论文阅读笔记：SENet: Squeeze-and-Excitation Networks

「Medical Image Analysis」Notes on Concurrent Spatial and Channel Squeeze & Excitation

Concurrent Spatial and Channel ‘Squeeze & Excitation’ in Fully Convolutional Networks(附代码)

Xception,Inception-ResNet,SENet(Squeeze-and-Excitation)

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)