机器学习： K-means 聚类 - 代码天地

机器学习： K-means 聚类

其他 2018-09-12 20:08:51 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/shinian1987/article/details/80554028

今天介绍机器学习里常见的一种无监督聚类算法，K-means。我们先来考虑在一个高维空间的一组数据集， $S = \{ \mathbf{x}_1, \mathbf{x}_2, ... , \mathbf{x}_N \}$ ， $\mathbf{x} \in \mathbb{R}^D$ ，假设我们需要把这组数据聚集长 $K$ 类，不失一般性，我们可以假设每个聚好的类都有一个中心 $\mathbf{ \mu}_k$ ，如果聚类完成的话，那么数据集中的每一个点 $\mathbf{x}$ 会有一个中心 $\mathbf{ \mu}_k$ 离这个点的距离最近。可以构造一个变量 $r_{nk} = \{ 0, 1 \}$ 表示变量 $\mathbf{x}$ 离第 $k$ 类最近 $r_{nk} = 1$ ，离其他的类更远 $r_{nj} = 0, j \neq k$ ，那么我们可以定义如下的目标函数：

J = \sum_{n = 1}^{N} \sum_{k = 1}^{K} r_{n k} | | x_{n} - μ_{k} | |^{2}

$J = \sum_{n=1}^{N} \sum_{k=1}^{K} r_{nk} || \mathbf{x}_n - \mathbf{ \mu}_k ||^2$

这个目标函数就是要求 $r_{nk} , \mathbf{ \mu}_k$ ，使得目标函数 $J$ 的值最小。

为了解决上面这个问题，因为要同时求 $r_{nk} , \mathbf{ \mu}_k$ 两个变量，所以我们会采取分步迭代的方法，当我们求 $r_{nk}$ 可以让 $\mathbf{\mu}_k$ 固定不动，当我们求 $\mathbf{\mu}_k$ 的时候，可以让 $r_{nk}$ 固定不动。

很显然，当我们求 $r_{nk}$ ，只有比较每一个 $\mathbf{x}_n$ 与 $\mathbf{\mu}_k$ 的距离，选择距离最近的一个类即可:

r_{n k} = 1 if = \arg m i n_{j} | | x_{n} - μ_{j} | |^{2}

$r_{nk} = 1 \quad \text{if} = \arg min_j || \mathbf{x}_n - \mathbf{ \mu}_j ||^2$

而求 $\mathbf{\mu}_k$ 的时候，我们可以让 $r_{nk}$ 固定不动，对目标函数 $J$ 求导，

2 \sum_{n = 1}^{N} r_{n k} (x_{n} - μ_{k}) = 0

$2 \sum_{n=1}^{N} r_{nk} ( \mathbf{x}_n - \mathbf{ \mu}_k ) = 0$

从而我们可以求得 $\mathbf{\mu}_k$ :

μ_{k} = \frac{\sum_{n} r_{n k} x_{n}}{\sum_{n} r_{n k}}

$\mathbf{\mu}_k = \frac{ \sum_n r_{nk} \mathbf{x}_n }{ \sum_n r_{nk} }$

通过这样的反复迭代，直到所有的 $r_{nk} , \mathbf{ \mu}_k$ 都不再变化。

猜你喜欢

转载自blog.csdn.net/shinian1987/article/details/80554028

机器学习： K-means 聚类

机器学习：K-Means聚类、DBSCAN聚类

机器学习——聚类算法之K-means与K-means++,K-meansⅡ

K-means 聚类学习

机器学习之K-Means聚类

机器学习(九)聚类K-means

【opencv、机器学习】聚类算法——K-means

机器学习之K-means、Canopy聚类

机器学习笔记之K-means聚类

机器学习08：K-Means聚类算法

机器学习-无监督聚类K-means

机器学习--聚类系列--K-means算法

机器学习之聚类算法k-means

机器学习部分：K-means聚类算法

Python机器学习应用之k-means聚类

【机器学习】使用K-Means聚类细分客户

【机器学习】K-means聚类算法初探

机器学习——K-means算法（聚类算法）

机器学习算法--K-means聚类

机器学习（1）：K-MEANS聚类算法

机器学习--k-means聚类原理

Python机器学习聚类算法K-MEANS DBSCAN

机器学习6——聚类，k-means算法

机器学习-聚类-k-Means算法

机器学习 - 算法 - 聚类 K-MEANS 算法

机器学习之聚类（K-means）

【机器学习】 k-means聚类算法

机器学习（聚类二）——K-Means

机器学习（聚类四）——K-Means的优化算法

机器学习（聚类三）——K-Means 代码实现

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)