论文阅读：cvpr2020 行人重识别 Relation-Aware Global Attention

Relation-Aware Global Attention for Person Re-identification阅读笔记

作者：Zhizheng Zhang， Cuiling Lan，Wenjun Zeng，Xin Jin，Zhibo Chen
来源：CVPR 2020
文章链接：https://arxiv.org/pdf/1904.02998v1.pdf
代码链接：https://github.com/microsoft/Relation-Aware-Global-Attention-Networks
动机：在行人重识别研究中，注意力机制可以强化区分特征，抑制无关特征。
以前的方法通常使用局部卷积来学习注意力，忽略了从全局结构模式中挖掘知识。作者为了使网络更好的进行attention学习,提出了Relation-Aware Global Attention (RGA) module。
解决方法：
1、作者通过设计attention,让网络提取更具有区别度的特征信息。简单来说，就是给行人不同部位的特征加上一个权重，从而达到对区分特征的增强，无关特征的抑制。
2、作者在这篇论文中提出了一个Relation-Aware Global Attention (RGA) 模型挖掘全局结构相关信息，使得attention集中在有区分度的人体部位，并且考虑到每个特征节点和全局特征之间的关系。用来模拟人的视觉系统，对不同的特征付出不同的注意力。
3、对于每一个代表空间位置的特征向量节点，取所有节点之间的成对关系，加上当前节点来表征全局结构信息。对于一个特征集合V = {xi ∈ R d , i = 1, · · · , N}，有N个相关特征，通过学习一个表示的mask矩阵，用a=(a1, · · · , aN )表示，用来衡量每个特征的重要程度，通过attention更新的特征为zi = ai*xi，主要任务就是学习ai的值。
方法亮点：
如下图所示，在作者之前的attention学习中，有两种普遍的学习方法，分别为下图中的a和b。a1, · · · , a5 对应于五个特征向量 x1, · · · , x5的attention值。
a) 使用卷积神经网络，对每一个特征x,学习一个attention值，因此只能学习到局部特征，而忽视了全局特征。
b) 使用全连接网络，学习到的attention值来自于所有特征向量的连接，虽然学习到了全局特征，但参数量过大，计算量太大。
c) 通过考虑全局的相关信息学习attention值，即对每一个特征向量，全局的关联信息用一个关系对ri = [ri,1, · · · , ri,5, r1,i, · · · , r5,i]表示，其中ri,1表示第i个特征节点和第一个特征节点的关系，以此类推。用一个符号ri&j = [ri,j , rj,i]表示,所有的ri&j组合可以得到x1一个关联特征，组合在一起得到下图中的特征向量r1，再和原始特征向量x1拼接，得到一个relation-aware feature y1, y1 = [x1, r1 ],作为提取attention的特征向量。因此可以看出，基于特征x1得到的attention值a1既包含了局部特征x1,又包含了全局所有特征之间的关系。

参考：
https://blog.csdn.net/baidu_41622980/article/details/107849683

模型介绍及代码实现：
可以看下面这链接：给出了模型的代码重点介绍，
https://blog.csdn.net/sol_data12/article/details/113622644

https://www.pythonheidong.com/blog/article/564949/4c71b25d25714d9841f3/
原始的resnet50 代码介绍这里面代码步骤比较详细一点

论文翻译：https://blog.csdn.net/qq_34124009/article/details/108483667
这篇翻译的有点水凑合看看
加一些自己的总结：
在这里插入图片描述

在这里插入图片描述

https://download.csdn.net/download/zqx951102/33676300
全部的ppt我上传在这了感兴趣的可以下载。

相互关联的博客：
https://blog.csdn.net/baidu_41617231/article/details/107271242?utm_medium=distribute.pc_relevant.none-task-blog-2_defaultCTRLIST_{default-2.no_search_link&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2}default_CTRLISTdefault-2.no_search_link
介绍三篇2020年论文的主要思想：
Relation-Aware Global Attention for Person Re-identiﬁcation（CVPR2020）
Multi-Granularity Reference-Aided Attentive Feature Aggregation for Video-based Person Re-identiﬁcation（CVPR2020）
Relation Network for Person Re-identiﬁcation（AAAI2020）

论文阅读：cvpr2020 行人重识别 Relation-Aware Global Attention

猜你喜欢