K-means聚类算法原理简单介绍

  • K-means算法

(1. 刚开始随机选择两个点作为簇重心,然后计算每个数据点离这个重心的距离并把这些点归为两个类)

(上一步的结果如下图,所有离蓝色叉近的点被标为蓝色了,红色亦然)

(下面的图中的两条直线是我自己加上去的,说明刚开始进行分类的时候是用直线来分割类的,在直线的上边则归为和红叉一类,在下面则归为和蓝叉一类,这条直线的选择是根据红叉和蓝叉连线的平分垂直线)

(2. 进行重心转移,即把所有蓝色点计算出平均值作为重心,红色点也是一样,计算出的结果如下图,这是第一次迭代)

(如上图,计算出重心后,再重新计算离红叉和蓝叉的点的距离,再重新分配簇。结果如下图)

(然后再重新计算这些点的平均值作为簇重心,这是第二次迭代,结果如下图,结果显示重心已经很收敛了,再进行迭代重心不会改变了)

猜你喜欢

转载自blog.csdn.net/caizhengye/article/details/51488205