032.(8.17-8.18)K-Means 算法

应用

在这里插入图片描述

在这里插入图片描述
(也可用于分离不佳的簇)

原理

在这里插入图片描述
生成初始聚类中心后,进行内循环:

第一步:簇分配
第二步:移动聚类中心

在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

如果存在一个没有点的聚类中心,常见做法是将它移除掉(K-1),也有重新随随机初始的做法。

代价函数

在这里插入图片描述

簇分配(对c)和移动聚类中心(对μ)的过程其实就是在最小化代价函数。

初始化聚类中心

随机样本法:

随机初始状态不同,最终收敛得到的结果可能会受影响。

局部最优问题

由前面提到的随机初始状态可以引出局部最优的情况。

改善方法:尝试多次初始化,以得到更好的局部最优解或全局最优解。
在这里插入图片描述
如果K过大,一般情况下多次初始化改善效果也不明显。

选取聚类数量

1.手肘法(缺陷也明显):
在这里插入图片描述
2.根据下层目的来选择在这里插入图片描述
(服务于后期/下游目的)

其他聚类算法

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/u013598957/article/details/108053869