【机器学习算法推导】K均值（K-means） - 代码天地

【机器学习算法推导】K均值（K-means）

编程语言 2018-12-31 21:41:48 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Hemk340200600/article/details/85466943

非监督算法是机器学习研究的一大领域，它适用于不带标签的样本数据，采取一定的算法，将样本分成自动分类成不同的簇。

K均值（K-meas）

K均值算法接收两个输入，一个是K，表示簇的数量，另一个是不带标签的训练集{ $x_1,x2,..x_m$ }。
算法过程如下：

随机初始化K个聚类中心 $\mu_1,\mu_2,...\mu_K$
遍历每个样本，对于每个样本，计算其与K个聚类中心的距离，将样本划分到距离最短的中心的簇内。
遍历每个聚类中心 $\mu_k$ ,计算被划分到簇 $\mu_k$ 的样本的均值作为 $\mu_k$ 的新位置。

令 $c^{(i)}$ 表示样本i被划分到的簇的下标，则损失函数可以定义为：
$J(c^{(i)},...,c^{(m)},\mu_1,...,\mu_k)=\frac{1}{m}||x^{(i)}-\mu_{c^{(i)}}||^2........(1)$
我们的目标就是最小化(1)，而算法步骤2和3的过程就是在最小化损失函数的过程。因此该算法是可行的。

距离的计算

通常使用欧式距离 $d=\sqrt{\sum\limits_{i=1}^m(x^{(i)}-y^{(i)})^2}$ 。

聚类中心初始化

方法：通常随机取K个样本作为初始聚类中心。

参数K的选择

肘部原则：画出K从1开始的损失函数值的图像，一开始，图像会下降地比较快，然后趋于平缓，整个形状看起来像人的手肘，我们所要做的就是选取肘部对应的K作为我们的参数K。因为选取它前面的参数的话，损失函数值太高，选取它后面的参数的话，损失函数值变化的量又太少，因此肘部可能是一个合适的参数。然而画出来的图像不一定总是存在肘部，也有可能是平滑的，不过也是一种值得尝试的方法。
另一种方法是根据后续的目的来决定K参数的取值。

总结

优点：易于实现，非常简单且使用广泛
缺点：可能收敛于局部最小值，在大规模数据下收敛慢，对初始聚类中心的位置较为敏感，参数K需要手动选择。

猜你喜欢

转载自blog.csdn.net/Hemk340200600/article/details/85466943

【机器学习算法推导】K均值（K-means）

机器学习之K均值(K-Means)算法

机器学习 | 算法笔记- K均值（K-Means）

机器学习之K-Means（k均值）算法

机器学习算法（7）——K近邻(KNN)与K均值(K-means)算法

机器学习（九）：k-均值（k-means）

机器学习实战（九）K-means（K-均值）

机器学习实战学习笔记 ---- K-Means（K-均值）聚类算法

机器学习---算法---k-means算法

机器学习之K均值算法（K-means）聚类

机器学习：原型聚类-k均值算法k-means(附代码实现)

Python机器学习算法实践——k均值聚类（k-means）

机器学习算法与Python实践之（五）k均值聚类（k-means）

ML-61: 机器学习之K均值(K-Means)聚类算法+代码

机器学习——K-均值聚类（K-means）算法

机器学习（二）——K均值聚类算法（K-means）

机器学习-聚类之K均值(K-means)算法原理及实战

机器学习（二）——K-均值聚类（K-means）算法

机器学习 K-均值聚类算法(K-Means)

机器学习算法之_K-均值聚类（K-means）

机器学习之k均值算法(K-means)聚类

机器学习实战：K-Means（K-均值）聚类算法

机器学习之K均值聚类算法K-Means（python代码实现）

机器学习算法之K-means

K-means算法-机器学习入门

机器学习（十一）：K-Means算法

机器学习--K-means算法

机器学习算法（2）-K-means

机器学习(十五) K-means 算法

机器学习——K-means算法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)