特征金字塔+自注意力:Salient Object Detection Combining a Self-attention Module and FPN

粗略看了一下,创新点比较直接
论文地址:https://arxiv.org/pdf/2004.14552.pdf

在这里插入图片描述

Abstract:

通过使用全卷积网络(FCN),显著性目标检测已取得了很大的进步。但是,基于FCN的U形体系结构可能会在自上而下的路径中的上采样操作期间导致高级语义信息中的稀释问题。因此,它可以削弱显著性目标定位的能力并产生退化的边界。为此,为了克服此限制,我们提出了一种新颖的金字塔自注意力模块(PSAM),并采用了独立的特征补充策略。在PSAM中,在多尺度金字塔特征之后配备了自注意层,以捕获更丰富的高级特征并将更大的感受野范围引入模型。此外,还采用基于通道的注意力模块来减少FPN的冗余功能并提供更完善的结果。实验分析表明,所提出的PSAM有效地有助于整个模型,因此在五个具有挑战性的数据集上,其性能均优于最新结果。最后,定量结果表明,PSAM可以生成清晰完整的显著性图,可以为其他计算机视觉任务(如对象检测和语义分割)提供进一步的帮助。

Self-Attention Based FPN:
在这里插入图片描述
简要说明:网络ResNet+ FPN结构,在top-down的时候,使用CAM。此外使用SAM模块对top-down特征图进行全局上下文信息聚合,以提供全局的语义信息。接下来介绍一下PSAM模块。

Pyramid Self-Attention Module:
在这里插入图片描述
简要说明:构建多尺度特征金字塔+各自尺度的自注意力机制+上采样统一尺度进行融合。其中SALayer应该就是Non-Local模块。

猜你喜欢

转载自blog.csdn.net/weixin_42096202/article/details/106222582