Unsupervised Person Re-identification via Multi-label Classification简单整理

Unsupervised Person Re-identification via Multi-label Classification简单整理

Abstract

无监督行人重识别(ReID)的挑战在于没有真实标签的情况下去学习鉴别特征。本文将无监督人员ReID描述为一个多标签分类任务,逐步寻找真实标签。该方法首先为每个人物图像分配一个单类标签,然后利用更新的ReID模型进行标签预测,进而发展为多标签分类。标签预测包括相似度计算和循环一致性,以保证预测标签的质量。为了提高多标签分类中ReID模型的训练效率,还进一步提出了基于记忆的多标签分类丢失(MMCL),将多标签分类和单标签分类集成在一个统一的框架中。该方法还允许在其他域中使用带标签的人物图像,在这种迁移学习环境下,也达到了最先进的性能。

Introduction

近年来行人重识别(ReID)技术取得了巨大的成功,利用CNN (deep Convolutional Neural Network, CNN)从带标记的人图像中学习区分特征。但是跨多个摄像机对人物图像进行注释的成本很高,因此最近的研究开始关注无监督,从未标记的人物图像中学习区分特征。与有监督学习相比,无监督学习减少了昂贵的数据注释需求,因此更有可能将person ReID推向真实应用。

在这里插入图片描述
许多研究所讨论的迁移学习的性能与域间隙密切相关,且灵活性受限,较大的域间隙会降低性能。所以本文的目标是在不利用任何标签数据的情况下提升无监督人员ReID。如上图所示将每个未标记的人物图像作为一个类,训练ReID模型为每个图像分配一个多类标签。由于每个行人通常都有多个图像,多标签分类可以有效地识别同一身份的图像,并将不同身份的图像区分开来。这反过来又促进了ReID模型优化类间和类内的距离。与以往将每张图像分类为单一类别的方法相比,多标签分类具有更好的效率和准确性。

该方法迭代预测多类标签,并在多标签分类损失的情况下对网络进行更新。如图所示,为了保证预测标签的质量,提出了基于记忆的正标签预测(MPLP),同时考虑了视觉相似性和周期一致性对标签进行预测。即如果两幅图像具有较大的相似度且相邻图像具有相似的邻域,则赋予两幅图像相同的标签。为了进一步保证标签预测的准确性,MPLP利用存储在记忆库中的图像特征,在每次训练迭代后用增强的特征更新记忆库,提高特征的鲁棒性。

预测标签允许CNN在多标签分类丢失的情况下进行训练。由于每个图像都被当作一个类来处理,大量的类使得训练像全连接(FC)层这样的分类器变得困难。如图所示,采用存储在存储库中的每幅图像的特征作为分类器。详细介绍了基于内存的多标签分类损失(MMCL)算法。MMCL通过放弃sigmoid函数,将分类分数赋值为1或-1,加速了损失计算,解决了传统多标签分类损失中的梯度消失问题。MMCL还涉及到硬负类挖掘,以处理正类和负类之间的不平衡。

综上所述,通过迭代运行MPLP和MMCL来寻找真标签,用于多标签分类和CNN训练。这种策略虽然没有利用任何标记数据,但取得了很好的性能。所维护的存储库加强了标签的预测和分类。研究还表明,与现有的迁移学习策略相比,无监督训练有可能实现更好的灵活性和准确性。

猜你喜欢

转载自blog.csdn.net/qq_34124009/article/details/107809144