Uncertainty-aware Clustering for Unsupervised Domain Adaptive Object Re-identification

论文

Uncertainty-aware Clustering for Unsupervised
Domain Adaptive Object Re-identification

主要贡献

  • HC模块:层次聚类算法,用于识别和分解不可靠的聚类。
  • UCIS模块:对实例进行可靠性判断,不可靠则丢弃

HC

相似的特征会被聚类到同一个类中,这样导致伪标签包含大量的噪声。SPCL将所有的异常点看作是离群点,这样会导致大量的实例信息丢失。作者为了估计一个聚类的可靠性,首先计算了一个聚类中所有实例的剪影系数([42] Rousseeuw, P.J.: Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. J.
Comput. Appl. Math. pp. 53–65 (1987)),对于第K个聚类中第i个实例的剪影系数计算表示为:
在这里插入图片描述
其中:f为特征,

  • a(fik)为第k个聚类中的第i个特征和这个类中其他特征计算的平均距离。
  • b(fik)为第k个聚类中的第i个特征和最相近的一个聚类中所有特征计算的平均距离

第k个聚类的平均剪影系数为:
在这里插入图片描述
当S(Ik) < 0的时候,即b(fik) < a(fik),这是一个不可靠的聚类。
当S(Ik) > α的时候,这是一个可靠的聚类,不改变这个聚类。反之不可靠。
实现细节,作者首先用DBSCAN算法设置超参eps为d,进行粗聚类,然后根据上述公式找到不可靠的聚类,再用dbscan算法设置超参为2/3d进行聚类。这样可以将一个不可靠聚类拆成多个聚类。由于不可靠聚类数量有限,这只会增加小部分计算量。

UCIS

尽管HC模块提高了聚类质量,但是很多聚类中仍有噪声。因此作者使用平均教师网络,教师网络的参数由momentum更新:
在这里插入图片描述
学生网络和教师网络都对聚类结果采用HC模块矫正聚类,然后作者认为一个聚类结果可靠的前提是这个聚类在学生网络的聚类结果中和教师网络的聚类结果中都包含了大量相同的实例,即重叠性较高。计算公式如下:
在这里插入图片描述
满足U(xi)>β的实例才被保留下来,不满足则舍弃。如下图:
在这里插入图片描述

整体结构

在这里插入图片描述
左边绿色为对聚类进行优化的操作,右边为损失计算的部分,损失计算主要有和memory的对比损失以及分类层的CE损失。

指标

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

Guess you like

Origin blog.csdn.net/qq_37668436/article/details/120133693