【Python学习笔记】使用python进行kmeans聚类

其他 2019-01-25 17:44:44 阅读次数: 0

使用python进行kmeans聚类

假设我们要解决一个这样的问题。

以下是一些同学，大萌是一个学霸，而我们想要找到这些人中的潜在学霸，所以我们要把这些人分为两类——学霸与非学霸。

	高数	英语	Python	音乐
小明	88	64	96	85
大明	92	99	95	94
小朋	91	87	99	95
大朋	78	99	97	81
小萌	88	78	98	84
大萌	100	95	100	92

1 方法一：使用scipy

那么使用scipy的Python实现的代码如下：

import numpy as np
from scipy.cluster.vq import vq,kmeans,whiten
list1=[88.0,74.0,96.0,85.0]
list2=[92.0,99.0,95.0,94.0]
list3=[91.0,87.0,99.0,95.0]
list4=[78.0,99.0,97.0,81.0]
list5=[88.0,78.0,98.0,84.0]
list6=[100.0,95.0,100.0,92.0]
data=np.array([list1, list2, list3, list4, list5, list6])
whiten=whiten(data) # 算出各列元素的标准差，形成一个新的数组
centroids,_=kmeans(whiten,2)
result,_=vq(whiten,centroids)
print(result)

其中，kmeans()函数的功能是对数据进行聚类，返回结果是一个元组，其中我们只需要它的第一个值，这是一个聚类中心数组。vq()函数的功能是矢量量化数据，它可以对每一个数据，也就是对我们这边的每一个人进行归类。

结果如下：

[1 0 0 1 1 0]

说明大明、小朋和大萌都是学霸组的。

需要说明的是，kmeans找到的只是一个局部最优解，而不是全局。

2 方法二：使用sklearn

那么使用sklearn的Python实现的代码如下：

import numpy as np
from sklearn.cluster import KMeans
list1=[88.0,74.0,96.0,85.0]
list2=[92.0,99.0,95.0,94.0]
list3=[91.0,87.0,99.0,95.0]
list4=[78.0,99.0,97.0,81.0]
list5=[88.0,78.0,98.0,84.0]
list6=[100.0,95.0,100.0,92.0]
X=np.array([list1, list2, list3, list4, list5, list6])
kmeans=KMeans(n_clusters=2).fit(X)
pred=kmeans.predict(X)
print(pred)

其中，fit()方法是对Kmeans确定类别以后的数据集进行聚类，而predict()是根据聚类结果，确定所属类别。

结果如下：

[0 1 1 1 0 1]

说明这次大明、小朋、大朋和大萌都是学霸组的。

再次说明，kmeans找到的只是局部最优解。

【参考】

[1]Coursera课程《用Python玩转数据》

猜你喜欢

转载自www.cnblogs.com/IvyWong/p/10320770.html

【Python学习笔记】使用python进行kmeans聚类

Python机器学习--聚类算法--Kmeans聚类算法

Python之聚类（KMeans,KMeans++）

kMeans聚类的python实现

python聚类算法kmeans

python学习⑤|利用Kmeans聚类算法进行主颜色提取

Python-深度学习-学习笔记（18）：Kmeans聚类算法与elbow method

使用Kmeans进行图像聚类

聚类算法-------K-均值(KMeans)算法原理和Python实现学习笔记

机器学习算法Python实现：kmeans文本聚类

机器学习实战-Python实现kMeans(k均值聚类)

机器学习笔记：kMeans聚类

Python中SKlearn中kmeans聚类

全面解析Kmeans聚类算法（Python）

GEE python：使用geemap进行kmeans聚类土地分类（土地分类函数已经更新需要变动）

Python3机器学习实践：Kmeans++聚类【实例：啤酒聚类】

python--kmeans聚类&DBSCAN聚类

OpenCV3.0 Examples学习笔记（13）-kmeans.cpp-kmeans函数实现对图像位置进行聚类

使用Python进行K均值聚类

使用scikit-learn进行KMeans文本聚类

【机器学习】--Kmeans聚类

机器学习-Kmeans聚类

一个基本的python实现聚类的例子机器学习sklearn19.0聚类算法——Kmeans算法

数学建模及机器学习算法（一）：聚类-kmeans（Python及MATLAB实现，包括k值选取与聚类效果评估）

机器学习之路：python k均值聚类 KMeans 手写数字

机器学习算法之聚类算法Kmeans并找出最佳K值的Python实践

菜鸟之路——机器学习之Kmeans聚类个人理解及Python实现

吴裕雄 python 机器学习——K均值聚类KMeans模型

python机器学习手写算法系列——kmeans聚类

python学习-111-通过sklearn实现自然语言处理的KMeans聚类方法

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)