聚类分析评估方法

一.轮廓系数

计算样本i到同簇其他样本的平均距离ai。ai 越小,说明样本i越应该被聚类到该簇。将ai 称为样本i的簇内不相似度。
计算样本i到其他某簇Cj 的所有样本的平均距离bij,称为样本i与簇Cj 的不相似度。定义为样本i的簇间不相似度:bi =min{bi1, bi2, ..., bik}


* si接近1,则说明样本i聚类合理
* si接近-1,则说明样本i更应该分类到另外的簇
* 若si 近似为0,则说明样本i在两个簇的边界上。

猜你喜欢

转载自www.cnblogs.com/xyp666/p/9216407.html