AlignedReID: Surpassing Human-Level Performance in Person Re-Identification

行人重识别之局部特征

AlignedReID: Surpassing Human-Level Performance in Person Re-Identification

原文链接:https://arxiv.org/pdf/1711.08184.pdf

本文的标题很唬人,其实叠加了很多的tricks。除了本文最重要的创新点局部特征联合之外,还利用了Mutual Learning、rerank、hard triplet loss。在Market1501和CUHK03上的mAP分别达到了90.7%和97.8%。所以虽然 tricks很多,但是也让我们看到了计算机的潜能。

接下来,重点聊聊这篇文章中提出的局部特征联合吧。

先看看网络结构:

在这里插入图片描述
global feature很简单,没什么特别的。主要看看local feature部分。对于每一张图片的2048x7x7的特征向量,通过池化和1x1卷积生成了128x7的特征图。共有七行,每一行与图片的七分之一的水平分割块相对应。

这也没什么特别的,看到这,一般人的想法都会认为所谓联合就是比较一下两张图的7个部分,计算出7x7=49种相似度,再算出总的相似度。但是作者提出来了一种神奇的新思想。

用f和g分别代表两张图的特征,每一个特征都有H(7)行,用如下公式计算出行与行之间的距离。这样就可以计算出一个7x7的矩阵。
在这里插入图片描述

重点来了,如何用这个矩阵计算总的相似度呢?

在这里插入图片描述
如上图所示,计算从(1,1)走到(7,7)的最短路径(也就是这条路径上所有的相似度之和最小)。这样,图中的拐点就表示两个图像相对应的位置,比如(2,4),表示A的第二块和B的第四块是对应的,而图中也确实是对应的。这样在优化的过程中,就会不断优化拐点的距离,同类减小,异类增大。直接实现了局部特征的充分利用,间接实现了图片的软对齐。

最后我们看一个例子,看看大家是否具备行人重识别的慧眼。

在这里插入图片描述
反正我是看不出来到底是第三个还是第六个,作者也没给答案。所以计算机确实挺厉害的…

总结:这篇文章让我们看到了计算机的潜力,所以AI确实大有可为。另外,引用作者的一句话作为结尾:the end-to-end learning with structure prior is
more powerful than a “blind” end-to-end learning

欢迎讨论 欢迎吐槽

发布了38 篇原创文章 · 获赞 142 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/weixin_39417323/article/details/88868554