聚类之k-means

其他 2019-03-12 12:11:28 阅读次数: 0

1、介绍

k-means算法以k为参数（所期望的簇的个数），把n个对象分成k个簇（单层划分），用质心（数据点的平均值）定义簇的原型。使得簇内具有较高的相似度，而簇间的相似度较低。

通过聚类，我们能够发现数据对象之间的关系。簇内的相似度越高，簇间的相似度越低，聚类效果越好。

2、过程

①随机选择k个点作为初始的聚类中心。

②对于剩下的点，根据其与聚类中心的距离，将其归入最近的簇，形成k个簇。

③对每个簇，计算所有点的均值作为新的聚类中心。

④重复②、③，直到聚类中心不再改变。

3、缺点

①可能收敛于局部最小值，在大规模数据中收敛较慢。

②k值需要预先给定，属于先验知识。

③对初始选取的聚类中心敏感。这会导致①。

④并不适合所有的数据类型，比如不能处理非球形簇。

⑤对含离群点的数据处理时存在问题。

为了克服k-means收敛于局部最小值的问题，可以采用二分k-means(bisecting K-means).

4、优化方法

1、bisecting K-means

①将所有样本看成一个簇。

②当簇小于k时，对于每个簇i，计算总误差，在簇i上进行2-means聚类，再计算该簇划分为两个簇后的总误差，选择误差最小的簇进行划分。

猜你喜欢

转载自www.cnblogs.com/ivan-count/p/10515755.html

聚类算法之K-Means

聚类之k-means

聚类之K-Means算法

机器学习——聚类算法之K-means与K-means++,K-meansⅡ

K-MEANS聚类

聚类——K-means

K-Means（聚类）

K-means 聚类

机器学习之K-Means聚类

数据挖掘之K-means聚类练习

聚类算法之K-Means 文本特征选择

Opencv图像分割之K-means聚类算法

机器学习之K-means、Canopy聚类

机器学习笔记之K-means聚类

机器学习之聚类算法k-means

机器学习之聚类（K-means）

聚类算法之K-Means算法原理及实现

无监督学习之K-Means聚类

聚类之k-means附代码

K-Means牛刀小试之文档聚类

机器学习聚类算法之K-means

聚类算法之Mini Batch K-Means 算法

【算法原理】聚类算法之K-means聚类与层次聚类

聚类算法之K-Means，K-Means++，elkan K-Means和MiniBatch K-Means算法流程

k-means聚类算法

K-means聚类算法初探

聚类算法k-means

K-Means聚类及图像压缩

k-Means算法，聚类算法

K-Means聚类的Python实践

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)