《用于图像语义分割的金字塔注意力网络》论文笔记

模块一:特征金字塔注意力模块(FPA)
在这里插入图片描述
结合了PSPNet或DeepLab提出的空间金字塔结构和SENet的注意力机制,结合不同尺度上下文信息的同时,还能为高层次的特征图提供更好的像素级注意力特征,扩大感受野的同时并有效的实现小目标的分类。

模块二:全局注意力上采样模块(GAU)
在这里插入图片描述
提取高层次特征的全局上下文信息,作为低层次特征的加权计算的指导(用高层特征给低层特征作指导)

整体网络模型:金字塔注意力网络( PAN)
在这里插入图片描述
消融实验
1.FPA模块
AVE 表示平均池化,MAX 表示最大池化,C333 代表全部使用 3×3 的卷积核,C357 表示所使用的卷积核分别为 3×3、5×5 和 7×7,GP 代表全局池化分支,SE 表示使用 SENet 注意力模块
2.GAU模块
(1) 仅使用跳跃连接的低级特征而没有全局上下文注意力分支。(2) 使用 1×1 卷积来减少 GAU 模块中的低层次特征的通道数。(3) 用 3×3 卷积代替 1×1 卷积减少通道数
3.对比其他经典网络模型
PASVAL VOC 2012 数据集
Cityscapes 数据集
文章链接:https://blog.csdn.net/guleileo/article/details/80544835

问题:FPN中为什么进行逐像素相乘,意义是什么?什么时候用相加什么时候用相乘?

猜你喜欢

转载自blog.csdn.net/qq_45234219/article/details/113868526
今日推荐