Learning Mid-level Filters for Person Re-identification(CVPR2014)

Abstract

在本文中,我们提出了一种新方法,用于从自动发现的补丁簇中学习中级滤波器以进行行人再识别。我们研究行人再识别好的滤波器是很好的动力。我们的中级滤波器是有区别地学习识别特定的视觉模式和区分行人,并具有良好的交叉视角不变性。首先,定性地测量局部斑块并用它们的辨别力进行分类。收集判别性和代表性的斑块用于过滤学习。其次,通过修剪层次聚类树获得具有相干外观的斑块簇,并且提出了一种简单但有效的交叉视图训练策略来学习视角不变和有判别的滤波器。第三,滤波器响应与RankSVM训练中的斑块匹配分数相结合。我们方法的有效性在VIPeR数据集和CUHK01数据集上得到验证。学习的中级特征是对现有手工低级特征的补充,并将VIPeR数据集上的最佳Rank-1匹配率提高了14%。

1. Introduction

行人再识别是基于外观匹配从非重叠相机视图观察到的行人图像。 由于其在威胁检测,行人检索和多相机跟踪中的重要应用,它在视频监控中受到越来越多的关注[23]。 它在从大量视频序列中彻底搜索感兴趣行人中节省了大量人力。 尽管经过多年的研究,行人再识别仍然是一项非常具有挑战性的任务。 在不同摄像机视图中观察到的人经常在视点,姿势和光照方面经历显著变化。 背景杂乱和遮挡引入了额外的困难。 此外,由于一些人具有相似的外观,因此匹配要查询的行人图像与来自图库的大量候选行人图像是一个巨大的挑战。

特征提取是行人再识别系统成功的最重要的组成部分。 与现有的使用手工制作特征的方法不同,我们建议从自动发现的补丁集群中学习中级过滤器。 过滤器捕获与特定身体部位相关的视觉模式。 整个工作的动机是我们研究对于行人再识别的好的过滤器以及训练这些过滤器的好的斑块集合,以及如何量化这些观察以指导学习过程。

(1)良好的中级滤波器应达到判别力与泛化能力之间的平衡。如图1所示,我们将训练图像中的斑块分为三类。常规斑块--- 绿色虚线框中的补丁经常出现在大部分行人图像中。从这种类型的补丁中学习的过滤器过于笼统,无法区分行人图像。稀有斑块 --- 黄色虚线框中的斑块表示出现在极少数行人图像中。从这种类型的补丁中学习的过滤器在新测试图像上具有非常低的泛化能力。包括从这两种类型的补丁中学习的过滤器进行重识别会增加计算成本。更重要的是,它们充当噪声通道并恶化识别性能。最后一类是有效补丁。红色虚线框中的色块以适当比例的行人图像显示。从中学习的过滤器在描述一组人的共同属性方面具有代表性,并且在区分身份方面是有效的。本研究将展示如何量化判别力和泛化能力以及如何选择有效斑块作为过滤器学习的候选者。

 (2)应该从具有一致外观的一组斑块中学习过滤器。 然而,由于聚类算法的不完善,一些斑块簇具有混合的视觉模式,如图2(a 1)(b 1)所示。斑块群集中学习的过滤器无法准确定位特定的视觉模式,因此会生成分散的过滤器响应。 相比之下,从图2(a 2)(b 2)中的斑块簇中学习的滤波器生成紧凑的响应并且可以准确地定位目标模式。

(3)人是一个结构良好的目标,有身体部位(例如头部和躯干)。 我们希望群集的块来自相同的身体部位,使得学习的过滤器可以捕获特定身体部位的视觉模式。

(4)学习过滤器应该对由身体关节,视点和光照变化引起的交叉视图变化具有鲁棒性。 图2(a 2)(b 2)中的滤波器响应是视图不变的。 该过滤器很好地匹配(a 2)和(b 2),它们是不同视图中同一行人的图像,同时区分(b 2)和(b'2)在同一视图中是不同的人。

基于以上观察,我们提出了一种学习中级过滤器的新方法,用于人员重新识别。它的贡献在于以下几个方面:
(i)基于观察(1),提出部分曲线下面积(pAUC)评分来测量局部斑块的辨别力。基于部分AUC量化来收集具有判别性和代表性补丁。
(ii)基于观察(2),构建层次聚类树以利用来自局部块的视觉模式。通过修剪树,我们收集相干簇节点作为过滤器学习的基元。
(iii)基于观察(3),所有斑块匹配,斑块聚类和滤波器学习在与空间约束相同的水平条带内完成。此外,通过将它们的位置作为特征来聚集斑块,使得聚集的斑块在空间上接近和区域固定。
(iv)基于观察(4),提出了一种简单但有效的交叉视图训练策略,以学习视图不变和有区别的SVM滤波器。过滤器响应被稀疏化以消除噪声和冗余。
(v)最后,将匹配得分的滤波器响应与RankSVM训练中的斑块匹配相结合。

通过对VIPeR [6]和CUHK01 [12]数据集的实验,显示了学习的中级滤波器的有效性。它实现了最先进的性能。我们学到的中级滤波器很好地补充了现有的手工低级特征。通过与LADF [14]相结合,它明显提高了VIPeR数据集上Rank-1匹配率的14%的现有技术水平。


2. Related Works

Existing person re-identification approaches work on three aspects: distance learning [29, 4, 12, 18, 30, 16, 14], feature design and selection [5, 3, 17, 15, 28, 7, 20, 25], and mid-level feature learning [11, 22, 10, 13]. A review can be found in [25].

In distance learning, distance metrics are discriminatively optimized for matching persons. Zheng et al. [30] introduced a Probabilistic Relative Distance Comparison(PRDC) model to maximize likelihood of true matches having a relatively smaller distance than that of a wrong match pair. Mignon and Jurie [18] proposed Pairwise Constrained Component Analysis (PCCA) to learn a projection from high-dimensional input space into a low-dimensional space where the distance between pairs of data points respects the desired constraints. It exhibits good generalization properties in presence of high-dimensional data. Liu et al. [16] presented a man-in-the-loop method to allow user quickly refine ranking performance, and achieved significant improvement over other metric learning methods. Lietal.[14] developed a Locally-Adaptive Decision Function (LADF) that jointly models a distance metric and a locally adaptive thresholding rule, and achieved good performance.

In feature design and selection, research works can be further divided into unsupervised [5, 3, 17, 15, 28, 25] and supervised [7, 20] approaches. (i) Unsupervised approaches: Farenzena et al. [5] proposed the Symmetry Driven Accumulation of Local Features (SDALF) by exploiting the symmetry property in pedestrian images to handle view variation. Cheng et al. [3] utilized the Pictorial Structures to estimate human body configuration and also computed visual features based on different body parts to cope with pose variations. Liu et al. [15] learned a bottom-up feature importance to adaptively weight features of different individuals rather than using global weights. (ii) Supervised approaches: Gray et al. [7] used boosting to select a subset of optimal features for matching pedestrian images.Prosser et al. [20] formulated person re-identification as a ranking problem, and learned global feature weights based on an ensemble of RankSVM.

Some research works on person re-identification have been done to learn reliable and effective mid-level features.Layneetal.[11]proposed to learn a selection and weighting of mid-level semantic attributes to describe people. Song et al. [22] used human attributes to prune a topic model and matched persons through Bayesian decision. However,learning human attributes require attribute labels for pedestrian images which cost human labor. It is much more costly than labeling matched pedestrian pairs, since each pedestrian image could have more than 50 attributes. Li et al. [13] proposed a deep learning framework to learn filter pairs, which encode photometric transforms across camera views for person re-identification. However, it requires larger scale training data. In this work, we automatically learn discriminative mid-level features without annotation of human attributes.

In a wider context, mid-level feature learning has been exploited in recent works on several vision topics. Singh et al.[21]andJainetal.[8]learnedmid-level features in scene classification and action recognition by patch clustering and measuring of the purity and discriminativeness with detection scores. Different from these works, we use hierarchical clustering and pruning to find coherent patch clusters, and jointly measures the representative and discriminative powers by proposed partial AUC quantization. Moreover, due to the nature of re-identification problem, our mid-level filter learning targets on cross-view invariance and considers constraints of body parts through patch matching. This is the first study of importance of mid-level filtering in person re-identification. Existing works on mid-level feature learning did not consider special challenges in person re-identification.

3. Patch Classification

我们的中级过滤器是从他们在不同位置具有辨别力和代表性的局部斑块中学习的。 斑块的辨别力通过其在行人图像中出现的频率来量化。 这是通过斑块匹配和计算部分曲线下面积(pAUC)得分来实现的。 在本节中,我们将介绍如何在不同视图中的图像之间建立色块的密集对应关系,以及如何基于匹配结果执行部分AUC量化。

3.1. Dense Correspondence

Dense features.提取密集网格上的局部补丁。 补丁大小为10×10,网格步长为5像素。 为每个斑块计算每个LAB通道中的32个bin颜色直方图和128维SIFT特征。 为了稳健地捕获颜色信息,还在每个贴片的另外两个下采样尺度上计算颜色直方图,其具有下采样因子0.5和0.75。 颜色直方图和SIFT特征用L2范数标准化,并且连接形成最终的672维密集局部特征。

Constrained Patch Matching.每一张图像的稠密局部特征被表示为,且代表来自摄像头A第u张行人图像的第m行第n列局部块的特征。其中,m=1,...,M,n=1,...,N,u=1,...,U。当块寻找来自摄像头B的第v张图像的相关块时,比如,中的约束搜索集合是

其中,h代表了搜索空间的高度。如果所有的行人图像都被良好的对齐而且这里没有垂直方向上的姿势变化,应该为0。然而,错位、相机视角的变化和垂直清晰度导致人体在图像中的垂直运动。因此,将h放大用来处理垂直运动是必要的。在我们的实验设置中我们选择h=2。

斑块匹配得到了广泛的应用,许多现成的快速算法[1]都可以以更快的速度进行。在这次工作中,我们简单地在搜索集为块使用近邻搜索。对于每一个块,从每个摄像头视角B的图像中查找最近的近邻( a nearest neighbor,NN)来构造一个NN集合

其中, 是等式(1)中定义的约束搜索集合,且代表之间的欧式距离。

3.2. Partial AUC quantization

Partial AUC Score. 为了量化局部patch在判别身份中的判别和泛化能力,我们提出了基于约束patch匹配得到的匹配距离计算pAUC分数。因为补丁和它在中最近邻之间的匹配距离在描述该块区分其他图像中相似块的能力是更有意义。pAUC分数被定义为块和它在的K近邻距离的累积,

其中,代表块和它在的K近邻的距离,是最近邻的数量被包含在计算pAUC分数中。在实验中,我们设置。小的暗示了块有许多来自于摄像头视点B的相似块,且描述一组特定的人太笼统了。大的表明了该补丁与其他视点大多数的块都不同,且他只能用来描述一部分拥有相似外观的行人。中等大小的表明了该补丁与另一个视图中的部分补丁相似,它能够描述一组人的公共属性。

Quantization.为了分别考虑在不同身体部位的块,我们首先按照如下方式划分局部块成Ny水平条

其中,是第y个条的块集合。然后,我们将一个条带内的patch按照它们的pAUC分数统一量化为水平,如下所示,

其中,

在我们的实验中,块被量化为而且每一个stripe被量化到,如图3所示。

4. Learning Mid-level Filters

4.1. Hierarchical Patch Clustering

虽然局部斑块采用局部AUC量化进行分类,但是不同视觉信息的斑块仍然混合在一起。因此,聚类是将斑块分组为具有一致视觉外观的子集。在我们的任务中,斑块通常具有高维度,并且数据的分布通常具有不同的密度、大小和形式多样的结构特性。因此,对于聚类斑块,采用图等级链接(graph degree linkage, GDL)算法[26],可以很好地处理这些问题。理想的过滤器应该从一组具有一致外观的补丁中学习。然而,由于聚类算法的不完善和确定合适的聚类粒度的困难,一些patch集群具有混合的视觉模式。从这些斑块集群中学习的过滤器不能准确定位特定的视觉模式。我们提出用粗到细的颗粒对斑块进行聚类来构建层次树,并通过对树的修剪来寻找一致的斑块簇。给定等式(5)中的一组块,我们构建了一个阶和最大深度为的层次聚类树,即树中的每个父节点都有个子节点,节点有层。我们在实验中设置。根节点包含集合中所有的块,树中的其他节点是由粗粒到细粒的斑块簇。如图4(虚线框)中显示,在层次聚类中,将浅节点(黑色)分解为深节点(蓝色)。浅节点表示粗簇,而深节点表示更精细的簇。 要学习能很好地描述特定视觉模式并生成紧凑过滤器响应的中级过滤器,我们只保留层次聚类树中的深层节点,即仅当此节点中的补丁数低于阈值Tmax时才选择节点。 另外,此外,具有非常少的补丁的群集节点被修剪阈值Tmin。 补丁集群的示例如图4所示。实验中,我们设置,保留的集群节点集被表示为,其中,是簇节点的数量。

4.2. Learning Mid-level Filters

给定所有保留的簇节点,我们针对性地学习滤波器:(1)对于视点变化造成的外观和光照变化具有鲁棒性;(2)有能力区分大多数令人困惑的照片。我们首先基于密集对应执行初始匹配,然后基于初始匹配在有监督的交叉视图训练策略中学习中级过滤器。

Initial Matching.由于已经为来自两个摄像机视图的图像建立了密集的对应关系,因此可以基于斑块匹配分数来初始匹配图像,

其中,分别是图像和图像匹配的块的索引,是一个带宽参数,是相似性得分的权重,将在集成匹配模型中自动学习(see Section 4.3),同时我们初始化集合,其中相似性得分通过归一化(单位方差)pAUC得分的一致性加权。 初始匹配模型将用于中级过滤器的跨视图训练。

Cross-view Training.所学习的滤波器对于由身体关节,视点和光照变化引起的交叉视图变化应该是鲁棒的,并且对于来自不同人识别同一个人是有辨别力的。 我们在一个简单但有效的交叉视图训练方案中学习了每个保留的集群节点Node k的过滤器。在Node k中所有的块被放入一个正集合,而且在同一条带中的其他簇结点的块被随机采样形成一个负集合。然而,这些还不足以学习一个有鲁棒性和具有判别能力的滤波器。为了确保学习过滤器在两个视图的匹配图像中稳健地产生一致的响应,对于每一个块在匹配图像中它的匹配块被添加到一个辅助的正块集合中,正如图5红色实心箭头所示。这样,在两个视图以及交叉视图中学习的滤波器可以产生较高的滤波器响应。另一方面,由于初始匹配模型在从一部分不匹配图像中找到真实匹配时存在一些混淆,因此可以从最混乱的不匹配图像中挖掘出额外的负块,以避免对它们的高滤波器响应,比如,我们在错匹配的图像中对匹配块进行采样来建造一个辅助的负集合用来学习滤波器,如图5中的蓝色实心箭头所示。由于顶级排名中的图像更加混乱,因此采样基于降低的概率分布,如图5的右下方所示。

在构造完正负块集合,我们为每一个簇节点简单地使用训练数据训练一个线性SVM[2]滤波器,。因为在簇节点中的块属于第个条纹,相应的SVM滤波器在条带内被空间约束。使用一组SVM滤波器,通过第yk条纹内的检测分数的最大池化来计算每个图像的滤波器响应。我们定义视点A中第u张图像的滤波器响应为

Normalization and Sparsity. 对于每个滤波器,其响应首先使用所有图像的L2范数进行归一化,以确保其与其他滤波器一样有效。 然后,对于每个图像,所有滤波器的响应用L2范数归一化。我们定义表示视点A中第u张图像的归一化滤波器响应。为了在滤波器响应中抑制噪声,稀疏性通过然后被加到。正如5.2中评价结果建议的,在试验中,我们设置,稀疏的滤波器响应被定义为,相似地,视点B中的滤波器响应也可以得到。

4.3. Integrated Matching Scores

我们整合滤波器响应和等式(6)中的最初的匹配分数到一个统一的匹配模型中,

其中,是定义在等式(6)中的块匹配得分,是第个滤波器响应之间的匹配得分,是带宽参数,而且w是统一的权重系数,它是通过RankSVM训练学习的[27]。

5. Experimental Results

5.1. Datasets and Evaluation Protocol

我们在两个公共的数据集上评估了我们的方法,VIPeR数据集[6]和CUHK01数据集[12]。VIPeR数据集是最广泛使用的行人再识别数据集,CUHK01包含比VIPeR更多的图片(3884 vs. 1264)。这两个数据集对于行人再识别都具有挑战性,因为它们展示了在视点、姿态和光照等有意义的变量,而且他们的图像都是低分辨率,存在遮挡和背景噪声。所有定量结果都在标准累积匹配特征曲线中报告[24].

VIPeRDataset[6]是在室外学术环境中由两个手持摄像机拍摄的。它们被放置在不同的位置,形成不同的视图对。它包含了632对行人,每一对都有两张同一人的照片,从不同的相机视角观察到。大多数图像对显示视点变化大于90度。所有图像规范化为128×48进行评估。

CUHK01 Dataset[12] 在校园环境中也有两个摄像头视图,其中包含971个人,每个人有两个摄像头视图的两个图像。相机A捕捉行人的正面或背面视图,而相机B则捕捉侧面视图。所有的图片都规范化为160×60进行评估。

5.2. Evaluations and Analysis

Evaluation of Partial AUC Quantization.我们研究了部分AUC量化对重新识别中rank-1匹配率的影响。正如图6(a)中所示,中等的pAUC水平具有最高的Rank-1表现,因为这些pAUC水平中的斑块在描述一组人的共同特性方面具有代表性并且在区分身份方面是有效的。 低等pAUC水平获得比中等水平更低的性能,因为具有低等pAUC评分的斑块经常出现在行人图像中并且过于笼统地区分身份。 高等pAUC水平具有最低的性能,因为这些水平的斑块在行人图像中显得非常少并且具有低的泛化能力。

Evaluation of Cross-view Training.为了验证Section4中的交叉视点训练的有效性,我们用四种设定的方式在CUHK01数据集上进行评估,,其中,代表使用(辅助的)正样本进行学习的滤波器,同理。如图6(b)所示,S4有较好的表现因为它考虑到视点不变属性和区分令人困惑的照片。因此,我们在训练中采用S4。

Evaluation of Sparse Filtering.我们还评估了在过滤器响应中加强稀疏性的有效性。如图6(c)所示,rank-1性能随着稀疏性(过滤器响应中0的百分比)的变化而变化,并且性能在[0,0.5]内是稳定的。

Evaluation of Learned Filters.等式(9)中学习的权重参数表明每一个滤波器的响应值的重要性,它包含了具有平均空间分布的正训练斑块和具有平均空间分布的高分数测试斑块的例子。如空间分布6(d)所示,红色实线框中的高权重的滤波器(第一行)有着可区分的视觉模式同时大部分不一行人身体结构,但是蓝色实线框中的低权重的滤波器(第二行)要么在背景中,要么在没有意义的视觉模式中。

5.3. Comparison with State-of-the-Arts

Evaluation Protocol. 我们对两个数据集的实验都遵循[7]中的评估协议,即我们将数据集随机分成两个偶数部分,50%用于训练,50%用于测试,没有人身份重叠。 来自摄像机A的图像用作探头,而来自摄像机B的图像用作图库。 每个探测图像与图库中的每个图像匹配,并获得正确匹配的等级.Rank-k匹配率是在等级k处正确匹配的期望,并且所有等级的识别率的累积值被记录为一个试验结果CMC。 进行了10次评估试验以获得稳定的统计数据,并报告了期望。

Result and Analysis.在VIPeR数据集上,我们首先与学习中级特征的方法进行比较,即AIR [11],MLA [10]和ARLTM [22]。如图7(a)所示,我们的方法明显优于此类别中的所有其他方法,这验证了我们的中级过滤器的有效性。我们还将我们的方法与基准测试方法进行了比较,包括SDALF [5],eBiCov [17],eSDC [28],PRDC [29],aPRDC [15],PCCA [18],KISSME [9],LF [19],SalMatch [27]和LADF [14]。如图7(b)所示,我们的方法实现了1级准确率29.11%,并且几乎超过了所有基准测试方法。通过在相同的训练/测试分区下与性能最佳的LADF相结合,它在rank-1匹配率上显着提高了14%的技术水平。在CUHK01数据集上,我们的方法与L1范数距离,L2范数距离,SDALF [5],eSDC [28],LMNN [12],ITML [12],GenericMetric [12]和SalMatch [27]进行了比较。 。如图7(c)所示,我们的方法明显优于此数据集上的所有先前方法。与VIPeR数据集上的结果相比,更大改进的一个可能原因是CUHK01数据集中的图像具有更好的分辨率,其中过滤器被更好地学习。

6. Conclusion

在本文中,我们建议学习用于行人再识别的中级过滤器。 我们通过引入pAUC评分来探索局部斑块的不同辨别能力。 收集具有辨别力和代表性的局部斑块用于学习过滤器。 通过修剪层次聚类树来获得相干补丁簇,并且提出了一种简单但有效的交叉视图训练策略来学习在区分身份时视图不变和区别的过滤器。 此外,匹配得分的过滤器响应与RankSVM训练中的补丁匹配相结合。 实验结果表明,学习中级过滤器大大提高了行人再识别的性能。

References
[1] C. Barnes, E. Shechtman, D. B. Goldman, and A. Finkelstein. The
generalized patchmatch correspondence algorithm. In ECCV, 2010.
3
[2] C.-C. Chang and C.-J. Lin. Libsvm: a library for support vector
machines. In ACM TIST, 2011. 6
[3] D. S. Cheng, M. Cristani, M. Stoppa, L. Bazzani, and V. Murino.
Custom pictorial structures for re-identification. In BMVC, 2011. 2
[4] M. Dikmen, E. Akbas, T. S. Huang, and N. Ahuja. Pedestrian recog-
nition with a learned metric. In ACCV, 2011. 2
[5] M. Farenzena, L. Bazzani, A. Perina, V. Murino, and M. Cristani.
Person re-identification by symmetry-driven accumulation of local
features. In CVPR, 2010. 2, 8
[6] D. Gray, S. Brennan, and H. Tao. Evaluating appearance models for
recognition, reacquisition, and tracking. In PETS, 2007. 2, 6
[7] D. Gray and H. Tao. Viewpoint invariant pedestrian recognition with
an ensemble of localized features. In ECCV. 2008. 2, 3, 8
[8] A. Jain, A. Gupta, M. Rodriguez, and L. S. Davis. Representing
videos using mid-level discriminative patches. In CVPR, 2013. 3
[9] M. Kostinger, M. Hirzer, P. Wohlhart, P. M. Roth, and H. Bischof.
Large scale metric learning from equivalence constraints. In CVPR,
2012. 8
[10] R. Layne, T. M. Hospedales, and S. Gong. Towards person identi-
fication and re-identification with attributes. In ECCV Workshops,
2012. 2, 8
[11] R. Layne, T. M. Hospedales, S. Gong, and Q. Mary. Person re-
identification by attributes. In BMVC, 2012. 2, 3, 8
[12] W. Li, R. Zhao, and X. Wang. Human reidentification with trans-
ferred metric learning. In ACCV, 2012. 2, 6, 8
[13] W. Li, R. Zhao, T. Xiao, and X. Wang. Deepreid: Deep filter pairing
neural network for person re-identification. In CVPR, 2014. 2, 3
[14] Z. Li, S. Chang, F. Liang, T. S. Huang, L. Cao, and J. R. Smith.
Learning locally-adaptive decision functions for person verification.
In CVPR, 2013. 2, 8
[15] C. Liu, S. Gong, C. C. Loy, and X. Lin. Person re-identification:
what features are important? In ECCV, 2012. 2, 3, 8
[16] C. Liu, C. C. Loy, S. Gong, and G. Wang. Pop: Person re-
identification post-rank optimisation. In ICCV, 2013. 2
[17] B. Ma, Y. Su, and F. Jurie. Bicov: a novel image representation for
person re-identification and face verification. In BMVC, 2012. 2, 8
[18] A. Mignon and F. Jurie. Pcca: A new approach for distance learning
from sparse pairwise constraints. In CVPR, 2012. 2, 8
[19] S. Pedagadi, J. Orwell, S. Velastin, and B. Boghossian. Local fisher
discriminantanalysisforpedestrianre-identification. InCVPR,2013.
8
[20] B. Prosser, W.-S. Zheng, S. Gong, T. Xiang, and Q. Mary. Person
re-identification by support vector ranking. In BMVC, 2010. 2, 3
[21] S. Singh, A. Gupta, and A. A. Efros. Unsupervised discovery of
mid-level discriminative patches. In ECCV, 2012. 3
[22] M. Song, C. Chen, J. Bu, X. Liu, Q. Zhao, and D. Tao. Attribute-
restricted latent topic model for person re-identification. In Pattern
Recognition, 2012. 2, 3, 8
[23] X. Wang. Intelligent multi-camera video surveillance: A review. In
Pattern Recognition Letters, volume 34, pages 3–19, 2013. 1
[24] X. Wang, G. Doretto, T. Sebastian, J. Rittscher, and P. Tu. Shape and
appearance context modeling. In ICCV, 2007. 6
[25] X. Wang and R. Zhao. Person re-identification: System design and
evaluation overview. In Person Re-Identification. Springer, 2014. 2
[26] W. Zhang, X. Wang, D. Zhao, and X. Tang. Graph degree linkage:
Agglomerative clustering on a directed graph. In ECCV, 2012. 4
[27] R. Zhao, W. Ouyang, and X. Wang. Person re-identification by
salience matching. In ICCV, 2013. 6, 8
[28] R. Zhao, W. Ouyang, and X. Wang. Unsupervised salience learning
for person re-identification. In CVPR, 2013. 2, 8
[29] W.-S. Zheng, S. Gong, and T. Xiang. Person re-identification by
probabilistic relative distance comparison. In CVPR, 2011. 2, 8
[30] W.-S. Zheng, S. Gong, and T. Xiang. Re-identification by relative
distance comparison. In PAMI, volume 35, pages 653–668, 2013. 2

猜你喜欢

转载自blog.csdn.net/weixin_37753215/article/details/81258113