【Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition】

基于弱监督细粒度方法的皮肤病分类

文章题目

Look Closer to See Better: Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition

文章来源

CVPR2019

作者动机

区域定位和细粒度特征学习是细粒度问题中的两大挑战。现有(19年之前)方法主要专注于独立解决这两个问题,然而忽略了两者的相关性,所以提出了一种新的架构——RA-CNN

作者思路

把一张输入的图片进行通过注意力提议网络(APN)进行剪裁,再经过双线性插值放大。其效果相当于丢掉图片中其他信息,放大“我”想看到的东西。效果如下:
在这里插入图片描述

网络架构

在这里插入图片描述
粗略解释:
输入一张原始图片,对于原始图片有两个任务,一是像常规的图像分类一样经过卷积——全连接——softmax进行分类,得到一系列类别的概率;二是在经过卷积之后得到的一系列特征图,经过注意力提议网络(APN)得到注意力的结果。如上图,我们的注意力在鸟头上,所以我们裁剪掉其他的部分,只留下鸟头,在将鸟头经过双线性池化放大。与文章题目呼应——看的更近看的更好

详细解释:
对于一张图片A,经过特征提取(卷积操作)——全连接——softmax,得到不同类别的概率P,如下图:
在这里插入图片描述
损失L(X)1为:
在这里插入图片描述
与此同时在特征提取之后得到一系列特征图,经过注意力提议模块
(APN),得到一个正方形的注意力块,记录为:
在这里插入图片描述
tx表示注意力的中心x坐标,ty表示注意力中心y的坐标,tl表示注意力块的边长的一半。这就是我们在原来的图片中需要留下的部分。

猜你喜欢

转载自blog.csdn.net/weixin_46516242/article/details/127853088
今日推荐