聚类指标Rand Index

假设一个集合中有N篇文章

一个集合中有N(N-1)/2个集合对

TP:同一类的文章被分到同一个簇

TN:不同类的文章被分到不同簇

FP:不同类的文章被分到同一个簇

FN:同一类的文章被分到不同簇

Rand Index度量的正确的百分比

RI = (TP+TN)/(TP+FP+FN+TN)


因此,FP=40-20=20.

同理,



因此,TN=96-24=72.

 

Same cluster

Different clusters

Same class

TP=20

FN=24

Different classes

FP=20

TN=72

RI=(20+72)/(20+20+24+72)=0.68

Precision=TP/(TP+FP)

Recall=TP/(TP+FN)

F1=2×Recall×Precision/(Recall+Precision)

Precision=20/40=0.5

Recall=20/44=0.455

F1=(2*0.5*0.455)/(0.5+0.455)=0.48

猜你喜欢

转载自blog.csdn.net/ws_developer/article/details/50751065