机器学习（9）-- 聚类-cluster - 代码天地

机器学习（9）-- 聚类-cluster

编程语言 2019-07-05 11:01:02 阅读次数: 0

聚类算法

聚类算法是一种非监督学习算法，根据数据集的分布特征，将其聚集为相互比较近的多个集合，集合的数量通常指定。

经典算法 k-means

k-means是经典的聚类算法，其算法流程如下：

随机或者有区分的选取k个点作为k个种类的中心
分别计算所有点到每个中心的距离，并将其归入最近的类
再次计算每个类中所有点的平均中心
将每个类的中心位置更新，重复2,3直到每个点的所属类不在变化，或者达到设定的条件
例如下图：

从左到右依次给点编号为1,2,3,4，最开始选取1,2为两类的中心，则计算的
第一类：1
第二类：2,3,4
从新计算第二类的中心，由于其有三个点，其平均位置向右上方移动，第二个点离中心边远。因此第二次计算后分类为
第一类：1,2
第二类：3,4
从新计算中心，每个点的所属类都不在变化，算法结束

从上面可以看出，该算法相对简单，但是容易陷入局部最优，对于初始的每个类的中心的选择具有比较大的依赖

hierarchical cluster算法，层次聚类

算法流程：
共计k个点

对所有的数据点，每个点当做一个类，依次计算其量量之间的距离
将相邻最近的类归为一类，总类数减少为k-1
持续进行上述过程，直到达到结束标准
算法特点：

对于不知道预先有几个类的情况有比较好的表现
两个类之间的距离的计算有多种方法，
- 计算两个类中最近两个点的距离，容易让两个近点将离得很远的点聚合到一起
- 计算两个类中最远两个点的距离，容易让两个本来应该聚合的类因为特殊点很难聚合
- 两辆求距离获得平均值。

猜你喜欢

转载自blog.csdn.net/qq_38876114/article/details/94720283

机器学习（9）-- 聚类-cluster

机器学习（9） -- 聚类

【机器学习算法】【9】--聚类算法

《机器学习》第9章聚类

机器学习第9章（聚类）

131.005 Unsupervised Learning - Cluster | 非监督学习 - 聚类

[优达机器学习入门]课程9：聚类

《机器学习》周志华-CH9 聚类

机器学习—聚类

机器学习 -- 聚类

机器学习——聚类

机器学习聚类

机器学习：聚类

聚类 Cluster

机器学习之聚类

机器学习----聚类总结

聚类-机器学习周志华

机器学习算法——聚类

机器学习总结---聚类

机器学习--聚类算法

机器学习-聚类Clustering

Stanford机器学习--聚类

【机器学习】--Kmeans聚类

机器学习算法--聚类

机器学习-聚类算法

机器学习（九）--聚类

【机器学习】层次聚类

机器学习—聚类(Clustering)

机器学习 | 聚类-1

机器学习——谱聚类

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)