python 数据挖掘（11）-- 聚类分析 - 代码天地

python 数据挖掘（11）-- 聚类分析

编程语言 2018-08-29 04:12:43 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_32023541/article/details/82116984

这里介绍 Kmeans 聚类算法，K-Means 聚类算法在之前就介绍过，只不过哪个时候用的是 mahout

算法的原理和过程不再介绍了，在 NLP 专栏可以找到，不再累述，主要是这里增加了一个聚类结果可视化工具 TSNE,它的定位是高维数据的可视化，TSNE 提供了一种有效的数据降维方式，让我们可以在 2 维或者 3 维的空间对高维数据展示聚类结果。数据 consumption_data.xls

#-*- coding:utf-8 -*-
import pandas as pd
#参数初始化
inputfile = 'wajue/consumption_data.xls'
outputfile = 'wajue/data_type.xls'

# 聚类数量
k = 3
# 最大迭代次数
iteration = 500

data = pd.read_excel(inputfile,index_col = 'Id')
# 数据标准化
data_zs = 1.0*(data-data.mean()) / data.std()

from sklearn.cluster import KMeans
model = KMeans(n_clusters = k, n_jobs = 4, max_iter = iteration)
# 聚类
model.fit(data_zs)

# 打印结果
r1 = pd.Series(model.labels_).value_counts()
r2 = pd.DataFrame(model.cluster_centers_) # 聚类中心
# 连接，得到聚类中心对应的类别下的数目
r = pd.concat([r2,r1],axis =1)
r.columns = list(data.columns) + [u"类别数目"]
print r

# 聚类可视化
from sklearn.manifold import TSNE
tsne = TSNE()
# 进行数据降维
tsne.fit_transform(data_zs)
# 转换数据格式
tsne = pd.DataFrame(tsne.embedding_,index = data_zs.index)

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

# 不同类别用不同颜色和样式绘图
d = tsne[r[u"聚类类别"] == 0]
plt.plot(d[0],d[1],'r.')
d = tsne[r[u"聚类类别"] == 1]
plt.plot(d[0],d[1],'go')
d = tsne[r[u"聚类类别"] == 2]
plt.plot(d[0],d[1],'b*')
plt.show()

猜你喜欢

转载自blog.csdn.net/qq_32023541/article/details/82116984

python 数据挖掘（11）-- 聚类分析

【Python数据分析】数据挖掘建模——聚类分析

数据挖掘-聚类分析（Python实现K-Means算法）

数据挖掘-聚类分析

数据挖掘（聚类分析）

python数据分析-聚类分析（转载）

数据挖掘——聚类分析总结

数据挖掘-聚类分析【2】

[源码和文档分享]python数据分析（7）——挖掘建模（2）聚类分析

python数据分析：聚类分析（cluster analysis）

Python实现聚类分析（最近更新：2019/11/13）

【python数据挖掘课程】二十四.KMeans文本聚类分析互动百科语料

数据挖掘学习——聚类分析(k-均值聚类、DBSCAN、AGNES)、python代码

Python：层次聚类分析

python 聚类分析

数据挖掘之聚类分析（R语言）

数据挖掘之聚类分析详解（三）

数据挖掘之聚类分析详解（三）

数据挖掘之聚类分析详解（二）

数据挖掘之聚类分析详解（一）

数据挖掘之聚类分析（Cluster Analysis）

Python数据分析与挖掘实战 11章

python 聚类分析 k means

Python数据分析案例09——航空公司客户聚类分析

Python数据分析案例03——天气K均值聚类分析

python数据挖掘与分析

数据挖掘之聚类分析学习笔记(3)

数据挖掘之聚类分析学习笔记(1)

数据挖掘之聚类分析学习笔记(2)

【数据挖掘】使用R语言进行聚类分析

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)