吴恩达机器学习笔记——无监督学习与K-meas - 代码天地

吴恩达机器学习笔记——无监督学习与K-meas

其他 2019-02-20 22:00:53 阅读次数: 0

K-meas 算法概述

随机生成K个点，称为聚类中心。K-means算法实际上是一个迭代算法，他有两步动作。在算法的最开始，随机初始化K个聚类中心，坐标位置分别为 $u_{i}$ 。第一步是簇分配，第二步是移动聚类中心。遍历图中的每一个点，判断点跟哪个聚类中心的距离更近，进而划分到这个聚类中心名下，并将聚类中心的下标赋给对应样本点 $x^{(i)}$ 的 $c^{(i)}$ ，这个步骤其实也是代价函数的最小化过程。然后对所有 $c^{(i)}=k$ 的样本点向量求平均值（忽略 $x^{(0)}$ ）将聚类中心移动到同类点的均值处。重复以上过程，直到各个聚类中心已经不再移动了。如果有一个没有点的聚类中心，则一般做法是移除之。如果仍需保留K个簇，则可以重新随机初始化这一没有点的聚类中心。

K平均算法可以将一堆数据分类为K组，这类似于市场划分，可以应用到产品型号生产中去。

K-meas 算法代价函数

注意， $u_{c^{(i)}}$ 是 $x^{(i)}$ 代表的簇的聚类中心所在的坐标位置。K平均算法是根据代价函数找到使得其最小的c和u。这个代价函数的每次变动也叫失真。J也称为失真函数。第一步是u不变，找到使得失真函数最小的c。第二部c不变，找到使得失真函数最小的u。

避免局部最优

在算法的一开始，我们需要随机初始化聚类中心的位置。

最好的办法是从训练样本中随机挑选K个点，作为u1...uk。

然而，K平均算法可能收敛到不同的结果，这取决于初始化时聚类状态。我们可以尝试多次随机初始化，运行K算法，计算畸变函数 $J$ 。最后我们选取畸变值最小，也就是代价最小的。

当K较小，即约为2-10时，多次随机初始化效果较好。否则可能虽然有改善，但第一次的值已经相对不错，后面的改善较小。

K值的选择

“肘部”原则。
通过使用价值人工指定。

猜你喜欢

转载自blog.csdn.net/weixin_39714797/article/details/87389446

吴恩达机器学习笔记——无监督学习与K-meas

吴恩达机器学习笔记（一）——监督学习与无监督学习

吴恩达机器学习笔记--监督学习和无监督学习

吴恩达-机器学习笔记（监督学习+无监督学习）

吴恩达机器学习 - 无监督学习——K-means算法吴恩达机器学习 - 无监督学习——K-means算法

无监督学习(吴恩达机器学习)

吴恩达--无监督学习

无监督学习（吴恩达）

吴恩达机器学习（十一）K-means（无监督学习、聚类算法）

吴恩达机器学习 - 无监督学习——K-means算法

【吴恩达机器学习学习笔记01】监督学习和无监督学习介绍

吴恩达机器学习笔记之监督学习

吴恩达机器学习（一）——监督学习和无监督学习

【吴恩达机器学习笔记】003 无监督学习（Unsupervised Learning）

吴恩达机器学习笔记 —— 14 无监督学习

【机器学习课程笔记（吴恩达）】1.4 无监督学习

吴恩达机器学习笔记002——Unsupervised Learning（无监督学习）

[吴恩达机器学习课程笔记] week three 无监督学习

吴恩达机器学习视频的课后整理笔记（一）：监督学习（与无监督学习、半监督学习区别）

吴恩达：无监督学习很重要！

吴恩达机器学习（第十四章）---无监督学习kmeans算法

《吴恩达机器学习》13 无监督学习（聚类）

吴恩达《机器学习》课程总结(12)_无监督学习

吴恩达机器学习——第14章无监督学习

吴恩达机器学习课时3：监督学习

吴恩达《机器学习系列课程》学习笔记（二）：监督学习

吴恩达机器学习（一）监督学习与非监督学习

【每日一更】＜吴恩达-机器学习＞监督学习&非监督学习

【吴恩达机器学习笔记】002 监督学习（Supervised Learning）

吴恩达机器学习笔记2-监督学习

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)