Python数据分析与挖掘实战 14章 - 代码天地

Python数据分析与挖掘实战 14章

其他 2018-05-13 14:03:45 阅读次数: 0

因学习中发现《Python数据分析与挖掘实战》中的代码，有些不能实现，自己学习的时候走了很多弯路，特此分享可直接实现的代码，希望能让有需要的朋友少走弯路。

#14-1 离差标准化
import pandas as pd
inputfile='../14.2/business_circle.xls'
outfile='../14.2/standardized.xls'
data=pd.read_excel(inputfile,index_col=u'基站编号')
data=(data-data.min())/(data.max()-data.min())
data=data.reset_index()
data.to_excel(outfile,index=False)

#14-2谱系聚类图
import pandas as pd
inputfile='../14.2/standardized.xls'
data=pd.read_excel(inputfile,index_col=u'基站编号')

import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import linkage,dendrogram      #scipy的层次聚类函数
Z=linkage(data,method='ward',metric='euclidean')
P=dendrogram(Z,0)
plt.show()

#14-3 层次聚类算法
import pandas as pd
inputfile='../14.2/standardized.xls'
data=pd.read_excel(inputfile,index_col=u'基站编号')
k=3

from sklearn.cluster import AgglomerativeClustering         #sklearn层次聚类函数
model=AgglomerativeClustering(n_clusters=k,linkage='ward')
model.fit(data)
r=pd.concat([data,pd.Series(model.labels_,index=data.index)],axis=1)
r.columns=list(data.columns)+[u'聚类类别']

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
style=['ro-','go-','bo-']

xlabels=[u'工作日人均停留时间',u'凌晨人均停留时间',u'周末人均停留时间',u'日均人流量']
pic_output='../14.2/type_'

for i in range(k):
    plt.figure()
    tmp=r[r[u'聚类类别']==i].iloc[:,:4]
    for j in range(len(tmp)):
        plt.plot(range(1,5),tmp.iloc[j],style[i])
        plt.xticks(range(1,5),xlabels,rotation=20)
        plt.subplots_adjust(bottom=0.15)
        plt.savefig(u'%s%s.png'%(pic_output,i))

猜你喜欢

转载自blog.csdn.net/lonely2018/article/details/80186562

Python数据分析与挖掘实战 14章

《Python数据分析与挖掘实战》第14章——层次聚类

Python数据分析与挖掘实战第10章

Python数据分析与挖掘实战 12章

Python数据分析与挖掘实战 15章

Python数据分析与挖掘实战 11章

Python数据分析与挖掘实战第9章

Python数据分析与挖掘实战 13章

Python数据分析与挖掘实战第8章

Python数据分析与挖掘实战第7章

Python数据分析与挖掘实战第6章

Python数据分析与挖掘实战——第二章

《python数据分析与挖掘实战》第二章 python数据分析简介

《Python数据分析与挖掘实战》第15章——文本挖掘

《Python数据分析与数据挖掘实战》第十五章学习——文本分析

《Python数据分析与数据挖掘实战》第十章学习——数据清洗

《Python数据分析与数据挖掘实战》第十四章学习——层次聚类

《Python数据分析与数据挖掘实战》第九章学习——支持向量机

《Python数据分析与挖掘实战》第八章学习-关联规则Apriori

《Python数据分析与挖掘实战》第七章学习——K-means聚类

《Python数据分析与挖掘实战》第13章——回归+DNN

《python数据分析与挖掘实战》第12章协同过滤推荐算法程序实现

Python数据分析与挖掘实战——第一章

《Python数据分析与数据挖掘实战》第十二章学习——数据库连接+推荐

《Python数据分析与挖掘实战》第六章学习拓展——偷漏税用户识别

《Python数据分析与机器学习实战-唐宇迪》读书笔记第14章--音乐推荐系统实战

《python数据分析与挖掘实战》第11章应用系统负载分析与磁盘容量预测的程序实现--时间序列分析

学习笔记(14):零基础搞定Python数据分析与挖掘-数据的读取（三）

python数据分析实战-第9章-数据分析实例气象数据

python数据分析实战-第3章-numpy库

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)