机器学习实战学习笔记 ---- K-Means（K-均值）聚类算法 - 代码天地

机器学习实战学习笔记 ---- K-Means（K-均值）聚类算法

其他 2019-04-15 17:29:07 阅读次数: 0

版权声明：学习交流为主，未经博主同意禁止转载，禁止用于商用。 https://blog.csdn.net/u012965373/article/details/88877328

聚类是一种无监督的学习，它将相似的对象归到一个簇中，将不相似的对象归到不同的簇中。

相似这一概念取决于所选择的相似度计算方式。

K-Means是发现给定数据集的K个簇的聚类算法，之所以称之为 “K-均” 值是因为它可以发现K个不同的簇，且每个簇的中心采用的所含值的均值计算而成。

簇个数K是用户指定的，每一个簇通过其质心(centroid)，即簇中所有点的中心来描述。

聚类与分类算法的最大区别在于，分类的目标类别已知，而聚类的目标类别是未知的，

优缺点：

优点：容易实现

缺点：可能收敛到局部最小值，在大规模数据集上收敛较慢

使用数据类型：数值型数据

扫描二维码关注公众号，回复： 5898647 查看本文章

K-Means场景

主要用来聚类，但是类别是未知的。

例如：对地图上的点进行聚类。

K-Means术语

簇：所有数据点的集合，簇中的对象是相似的。
质心：簇中所有点的中心（计算所有点的均值而来）。
SSE：Sum of Sqared Error (平房误差和)，SSE值越小，表示越接近他们的质心，由于对误差取了平方，因此更加注重那么远离中心的点。

K-Means的工作流程：

1.首先确定K个初始点作为质心（不是数据中心的点）

2.然后将数据集中的每个点分配到一个簇中，具体来讲就是为每个点找到距离最近的质心。并将其分配该质心所对应的簇，这一步完成后，每一个簇的质心更新为该簇所有点的平均值。

上述过程的伪代码如下：

创建K个初始点作为质心（不是数据中的点）
当任意一个点的簇分配结果发生改变时
- 对数据集中的每个数据点
- - 对每个质心
  - - 计算质心与数据点之间的距离
  - 将数据点分配到距离其最近的簇
- 对每一个簇，计算簇中所有点的均值并将均值作为质心

猜你喜欢

转载自blog.csdn.net/u012965373/article/details/88877328

机器学习实战学习笔记 ---- K-Means（K-均值）聚类算法

机器学习实战：K-Means（K-均值）聚类算法

机器学习——K-均值聚类（K-means）算法

机器学习（二）——K-均值聚类（K-means）算法

机器学习 K-均值聚类算法(K-Means)

机器学习算法之_K-均值聚类（K-means）

【机器学习实战之三】：C++实现K-均值（K-Means）聚类算法

机器学习（二）K-均值聚类（K-means）

机器学习-聚类之K均值(K-means)算法原理及实战

机器学习实战（九）K-means（K-均值）

机器学习：原型聚类-k均值算法k-means(附代码实现)

机器学习之K均值算法（K-means）聚类

Python机器学习算法实践——k均值聚类（k-means）

机器学习算法与Python实践之（五）k均值聚类（k-means）

ML-61: 机器学习之K均值(K-Means)聚类算法+代码

机器学习（二）——K均值聚类算法（K-means）

机器学习之k均值算法(K-means)聚类

机器学习之K均值聚类算法K-Means（python代码实现）

机器学习——聚类算法之K-means与K-means++,K-meansⅡ

机器学习实战：K-均值及二分K-均值聚类算法

机器学习实战笔记：K-均值聚类

机器学习（九）：k-均值（k-means）

简单粗暴理解与实现机器学习之聚类算法（五）：优化、Canopy算法配合初始聚类、K-means++、二分k-means、k-中心聚类、Kernel k-means、ISODATA、Mini Batch

机器学习——K-means算法（聚类算法）

机器学习 - 算法 - 聚类 K-MEANS 算法

《机器学习实战》学习笔记———利用K-均值聚类算法对未标注数据分组

《机器学习实战》学习笔记第十章 —— K-均值聚类算法

机器学习实战学习笔记 --- 二分K-Means聚类算法

机器学习算法原理总结系列---算法基础之(11)聚类K均值(Clustering K-means）

机器学习之K-均值聚类算法

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)