[pytorch]语义分割之DANet: Dual Attention Network for Scene Segmentation(训练代码+预测代码) - 代码天地

[pytorch]语义分割之DANet: Dual Attention Network for Scene Segmentation(训练代码+预测代码)

其他 2020-03-01 20:18:01 阅读次数: 0

一，DANet（双注意力模型）

网络结构：

网络有两个注意力分支，一个是位置注意力模型(PAM)，另一个是通道注意力模型(CAM)：

位置注意力模型(PAM)：

A是通过Resnet网络提起的特征图，维度是CxHxW。把A送入一个卷积层，得到特征图B和C，B和C的维度也是CxHxW。然后把B和C的维度reshape成CxN,（N=HxW）即N是特征图的像素个数。然后再把B进行矩阵转置，维度就变成NxC。然后B和C进行矩阵乘法，得到一个NxN的注意力矩阵，其再通过softmax处理，就变成了S，S的维度也是NxN。

S的元素计算如下：

Sji 表示第i个像素对第j个像素的影响。两个像素越相近，他们的Sji值越大。

然后，再把A输入到一个卷积层，输出特征图D，D的维度是CxHxW，并把特征图D的维度reshape为CxN，然后再把D和S的转置矩阵(并reshape成CxHxW) 作矩阵乘法，最后乘上一个参数，和A加起来，得到最后的输出矩阵E，E的维度为CxHxW。

E的元素计算如下：

通道注意力模型 (CAM)：

与PAM的计算不同的是，CAM是直接计算注意力矩阵X的。先把特征图A的维度reshape为CxN(N=HxW)，然后再把A和A的转置矩阵进行矩阵乘法运算，再经过softmax层，就得到了注意力矩阵X了，X的维度为CxC，X的元素计算如下：

Xji 表示第i个通道对第j个通道的影响。

然后我们再把 X的转置矩阵与A做矩阵乘法，得到的矩阵的维度为CxR，再reshape成CxHxW，最后该矩阵乘上一个参数，再与A矩阵相加，就得到了最终的输出E矩阵，E的维度为CxHxW。E的元素计算如下：

二，代码链接：

https://github.com/Andy-zhujunwen/danet-pytorch

三，效果：

ZJE_ANDY

发布了270 篇原创文章 · 获赞 408 · 访问量 76万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/u014453898/article/details/100576769

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)