K-means算法聚类原理

所谓的聚类,就是将样本划分为由类似的对象组成的多个类的过程。聚类后,我们可以更加准确的在每个类中单独使用统计模型进行估计,分析或预测;也可以探究不同类之间的相关性和主要差异。
K-means聚类算法的流程:
1,指定需要划分的簇的个数K值(类的个数);
2,随机地选择K个数据对象作为初始聚类的中心(不一定是我们的样本点)
3,计算其余的各个数据对象到这K个初始聚类的中心的距离,把数据对象划归到距离它最近的那个中心所在的簇类中;
4,调整新类并且重新计算出新类的中心;
5,循环步骤3和4,看中心是否收敛(不变),如果收敛或达到迭代次数则停止循环;
6,结束
其中第四步的聚类中心就是重心。
其过程示意图如下在这里插入图片描述

发布了40 篇原创文章 · 获赞 0 · 访问量 2099

猜你喜欢

转载自blog.csdn.net/DDWDDZY/article/details/105128701