【论文阅读】Improving Person Re-identiﬁﬁcation by Attribute and Identity Learning

企业开发 2022-07-27 14:01:35 阅读次数: 0

导读

论文：pdf.sciencedirectassets.com/272206/1-s2…

代码：

本文可以算作行人重识别中的一个十分有特色的baseline。行人属性识别和和行人重识别的任务十分类似，只是细粒度些许不同。本文讨论的便是如何结合这两点。在进行re-id的同时预测属性。

简介

为 Market-1501 数据集和 DukeMTMC-reID 数据集手动标记了一组行人属性。
提出了一种新的属性行人重识别 (APR) 框架。它学习了用于行人重识别和属性识别的判别性属性。
引入了属性重加权模块（ARM），它根据学习到的属性之间的依赖和相关性来校正属性的预测。
提出了一种属性加速过程，通过从查询图像中过滤出具有不同属性的图库图像来加快检索过程。

在两个大规模数据集即 Market-1501和 DukeMTMC_reID上，与最先进的 re-ID 方法相比，提出的算法获得了具有竞争力的准确性。同时还展示了算法对于属性识别任务的基本模型性能的提高。

方法

首先要介绍两个baseline的方法，然后再来介绍本文的方法。

baseline1 ID-discriminative Embedding (IDE)

IDE是一个多粒度的re-id网络。简单来说，这个网络使用ResNet-50前三层提取图像的基础特征，将之后的后续部分划分为3个独立的分支，即在高层次的语义级特征作者设计了3个独立分支。第一个分支负责整张图片的全局信息提取，第二个分支会将图片分为上下两个部分提取中粒度的语意信息，第三个分支会将图片分为上中下三个部分提取更细粒度的信息。

Attribute Recognition Network（ARN）

ARN是本文提出来的一个baseline，这个网络只被用于带有属性的数据集上训练。将resnet50进行属性的分类。

Attribute-Person Recognition Network（APRN）

总览

APRN包含了两个预测部分，一个是用来预测属性，一个是来预测身份。使用cnn从给定的图像抽取特征。然后APR会根据抽取的特征来预测特征，这里需要计算真实标签和预测标签之间的损失。第二部分利用属性预测作为身份预测的额外线索。

简单来说，APRN会先计算单独属性的属性损失，然后这些损失会被拼接并输入到属性重权重模块（ARM）。而ARM的输出会和全局图像的特征进行拼接，最终的识别是简历在局部和全局特征的串联上的。

Attribute Re-weighting Module（ARM）

属性重权重模块，主要来学习属性之间的相关性。例如，当“粉红色上衣”和“长发”的预测分数非常高时，网络可能倾向于增加属性“女性”的预测分数。

$c=Sigmoid(v\breve{a}^{T}+b)$

其中 $\breve{a}$ 是图像被预测的属性特征向量, $v$ 和 $b$ 都是可以学习的参数， $c$ 是置信度。

$a=c·\breve{a}^{T}$

则 ARM 模块通过将置信度 $c$ 和预测向量 $\breve{a}^{T}$ 逐点相乘得到新的预测分数 $a$ 。然后连接全局身份的图像，进一步进行身份预测。

损失函数

属性预测的损失函数：

身份预测的损失函数：

总体的损失函数：

其中 $\{f_{A_{j}}(w_{A_{j}}; \phi(\theta;x_{i})) \}$ 是输入的特征， $a_{j}^{j}$ 是属性 $y_{i}$ 是身份。

属性加速

对于 Re-ID 系统来说计算检索距离是一个很大的开销。通过属性预测结果过滤掉 gallery 中与 query 属性不同的数据，将加速检索计算过程。属性过滤的具体过程如下：

首先设定一个阈值，如果某个属性的置信度，则认为该属性是可靠的。检查 query 和 galley 是否对该属性具有相同的预测。如果不是，则从 galley 中删除该候选图像。

在实际应用中，阈值的选择需要权衡效率和准确性。因此存在两种选择策略：激进的策略是设置较小的阈值（接近0），这样会移除大部分候选图片，适用于速度优先的情况。保守的策略是设置较大的阈值（接近1），仅移除少量图片。

在 Market-1501 的实证研究中，通过将阈值设置为 0.7，将检索过程加快了十倍以上，准确度下降了 2.92%。

实验证明

对比实验

文章对两个大规模 Re-ID 数据集 Market-1501 和 DukeMTMC-reID 以及一个属性识别数据集 PETA 进行了实验。 Market—1501：其中-代表手工提取的特征，*是自己设计的网络，

Duke：

PETA

消融实验

属性的影响

ARM的影响

其中 $\lambda$ 是属性的影响程度。

属性加速的影响

猜你喜欢

转载自juejin.im/post/7124931833719947271

【论文阅读】Improving Person Re-identiﬁﬁcation by Attribute and Identity Learning

论文阅读笔记（三十三）【CVPR 2019】：Joint Discriminative and Generative Learning for Person Re-identiﬁcation

Improving Person Re-identification by Attribute and Identity Learning

【论文笔记】Improving Person Re-identification by Attribute and Identity Learning

论文阅读笔记（三十八）【AAAI2020】：Semantics-Aligned Representation Learning for Person Re-identiﬁcation

论文阅读笔记（二）【IJCAI2016】：Video-Based Person Re-Identiﬁcation by Simultaneously Learning Intra-Video and Inter-Video Distance Metrics

论文阅读笔记（七）【TIP2018】：Video-Based Person Re-Identiﬁcation by Simultaneously Learning Intra-Video and Inter-Video Distance Metrics

论文阅读笔记（十二）【CVPR2018】：Exploit the Unknown Gradually: One-Shot Video-Based Person Re-Identiﬁcation by Stepwise Learning

论文阅读笔记（三十）【CVPR2020】：High-Order Information Matters: Learning Relation and Topology for Occluded Person Re-Identiﬁcation

Person Transfer GAN to Bridge Domain Gap for Person Re-Identiﬁcation论文阅读

论文阅读笔记（三十四）【CVPR2019】：Dissecting Person Re-identiﬁcation from the Viewpoint of Viewpoint

论文阅读笔记（九）【TIFS2020】：True-Color and Grayscale Video Person Re-Identiﬁcation

论文阅读笔记（二十三）【ECCV2018】：Robust Anchor Embedding for Unsupervised Video Person Re-Identiﬁcation in the Wild

论文阅读笔记（二十八）【IJCAI2018】：Cross-Modality Person Re-Identiﬁcation with Generative Adversarial Training

论文阅读笔记（四十四）【ICCV2017】：Deeply-Learned Part-Aligned Representations for Person Re-Identiﬁcation

Transferable Joint Attribute-Identity Deep Learning for Unsupervised Person Re-Identification理解

Transferable Joint Attribute-Identity Deep Learning for Unsupervised Person Re-Identification

论文阅读笔记（三十六）【AAAI2020】：Relation-Guided Spatial Attention and Temporal Reﬁnement for Video-based Person Re-Identiﬁcation

论文阅读笔记（二十一）【CVPR2017】：Deep Spatial-Temporal Fusion Network for Video-Based Person Re-Identiﬁcation

论文阅读笔记（二十三）【AAAI2018】：Video-Based Person Re-Identiﬁcation via Self Paced Weighting

论文阅读笔记（二十九）【CVPR2020】：Cross-modality Person re-identiﬁcation with Shared-Speciﬁc Feature Transfer

论文阅读笔记（四十二）【AAAI2019】：STA：Spatial-Temporal Attention for Large-Scale Video-based Person Re-Identiﬁcation

论文阅读笔记（三十九）【CVPR2017】：Spindle Net Person Re-identiﬁcation with Human Body Region Guided Feature Decomposition and Fusion

论文阅读笔记（三十七）【AAAI2020】：Frame-Guided Region-Aligned Representation for Video Person Re-identiﬁcation

论文阅读笔记（二十五）【CVPR2020】：Weakly Supervised Discriminative Feature Learning with State Information for Person Identiﬁcation

Mixed High-Order Attention Network for Person Re-Identiﬁcation摘要

Infrared-Visible Cross-Modal Person Re-Identiﬁcation with an X Modality (AAAI 2020)

Relation-Aware Global Attention for Person Re-identiﬁcation（CVPR2020）

论文阅读笔记（四十三）【AAAI2020】：Rethinking Temporal Fusion for Video-based Person Re-identiﬁcationon Semantic and Time Aspect

《Deep Transfer Learning for Person Re-identification》-阅读笔记

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)