【论文浅读】《Weakly Supervised Attention Pyramid Convolutional Neural Network for Fine-Grained Visual Cla》

创新思想:

文章提出了Attention Pyramid Convolutional Neural Network (AP-CNN) 注意金字塔卷积神经网络,提高了对对象子类分类的效率。该网络主要分为两大部分Attention Pyramid和ROI Pyramid:

Attention Pyramid:注意金字塔;top-down高层语意、bottom-up低层特征;

ROI Pyramid:感兴趣区域导向金字塔;dropblock细化特征、zoom-in消除噪声。

主要原理:

在这里插入图片描述
整体结构:(a)(b)Attention Pyramid和©ROI Pyramid。
在这里插入图片描述
Attention Pyramid结构:
(a) spatial attention pyramid:通过反卷积获取低层特征;
(b) channel attention pathway:通过池化和两次激活获取高层语意;

在这里插入图片描述
(b) channel attention pathway中的池化激活公式表达式。
在这里插入图片描述
ROI Pyramid示意图:
灰色dropblock:通过随机丢弃一些特征块,降低过拟合,细化特征;
黑框zoom-in:放大有效区域,消除噪声。

主要实验结果:

在这里插入图片描述
用了AP的金字塔网络的正确率比不用金字塔和只用特征金字塔的要高。
在这里插入图片描述
对比不同AP,其中:
C: Channel attention;
S: Spatial attention;
SP: Bottom-up spatial attention pathway;
CP: Bottom-up channel attention pathway;
在这里插入图片描述
对比ROI是否启用dropblock和zoom-in的正确率。

在这里插入图片描述
三个数据集的效果展示。

算法

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_34451909/article/details/106361081