ML 算法篇(1) k-means

 

K-Means

首先输入 k 的值,即我们指定希望通过聚类得到 k 个分组;

  1. 从数据集中随机选取 k 个数据点作为初始(质心); c={c1,c2,.....Ck}
  2. 对集合中每一个数据,计算与每一个质心的距离。用欧式距离
  3. 这时每一个中心下都聚集了一组数据,即通过算法选出新的质心,一般采用平均法。
  4. 针对每个之心,重新计算,所有的样本
  5. 重复2-4的,直到之心不在不变化。

优点:

1.算法简单

2.缺点,无法规避噪音。

K-means++算法

猜你喜欢

转载自blog.csdn.net/keny88888/article/details/82841243