K-Means
首先输入 k 的值,即我们指定希望通过聚类得到 k 个分组;
- 从数据集中随机选取 k 个数据点作为初始(质心); c={c1,c2,.....Ck}
- 对集合中每一个数据,计算与每一个质心的距离。用欧式距离
- 这时每一个中心下都聚集了一组数据,即通过算法选出新的质心,一般采用平均法。
- 针对每个之心,重新计算,所有的样本
- 重复2-4的,直到之心不在不变化。
优点:
1.算法简单
2.缺点,无法规避噪音。
首先输入 k 的值,即我们指定希望通过聚类得到 k 个分组;
优点:
1.算法简单
2.缺点,无法规避噪音。