深度聚类评估指标(Purity、NMI、RI、ARI)

深度聚类评估指标(Purity、ACC、NMI、RI、ARI)

Purity, NMI, RI 等上述指标均需要给定 truth label 才能对 cluster label 进行评价,但是均不要求后者的类标与前者一致。那什么时候需要进行类标签的 best map 呢?例如,我们需要对预测结果和真实值之间统计聚类正确的比例时就需要进行最佳类标的重现分配,这样才能保证统计的正确。

Purity

定义

在这里插入图片描述

例子

在这里插入图片描述

NMI

定义

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

例子

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

RI

定义

在这里插入图片描述

例子

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

一个求混淆矩阵的 Python 实现

%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

label = [0,0,1,0,1,0,0,1]
pred = [0,0,0,0,0,1,1,1]
bins = np.array([0,0.5,1]) # 表示x,y轴每个 bin 的坐标范围
tn, fp, fn, tp = plt.hist2d(label, pred, bins=bins, cmap='Blues')[0].flatten() # flatten 按列展开

ARI

定义

在这里插入图片描述

例子

发布了64 篇原创文章 · 获赞 9 · 访问量 4336

猜你喜欢

转载自blog.csdn.net/Avery123123/article/details/103903767