【数据分析学习笔记day19】聚类模型 -- K-Means介绍+聚类模型+K-Means+ K-Means算法 +算法思想+ 算法描述+优缺点

其他 2020-01-25 22:10:13 阅读次数: 0

文章目录

聚类模型：K-Means

K-Means算法
算法思想：
算法描述：
优缺点：

聚类模型：K-Means

聚类（clustering）属于无监督学习（unsupervised learning）
无类别标记
在线 demo：http://syskall.com/kmeans.js

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XddDyvEu-1579958309751)(../images/K-Means.png)]

K-Means算法

数据挖掘十大经典算法之一
算法接收参数k；然后将样本点划分为k个聚类；同一聚类中的样本相似度较高；不同聚类中的样本相似度较小

算法思想：

以空间中k个样本点为中心进行聚类，对最靠近它们的样本点归类。通过迭代的方法，逐步更新各聚类中心，直至达到最好的聚类效果

算法描述：

选择k个聚类的初始中心
在第n次迭代中，对任意一个样本点，求其到k个聚类中心的距离，将该样本点归类到距离最小的中心所在的聚类
利用均值等方法更新各类的中心值
对所有的k个聚类中心，如果利用2,3步的迭代更新后，达到稳定，则迭代结束。

优缺点：

优点：速度快，简单
缺点：最终结果和初始点的选择相关，容易陷入局部最优，需要给定k值

汪雯琦

发布了192 篇原创文章 · 获赞 56 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_35456045/article/details/104084863

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)