Python数据分析与挖掘实战 13章 - 代码天地

Python数据分析与挖掘实战 13章

其他 2018-05-13 14:04:00 阅读次数: 0

因学习中发现《Python数据分析与挖掘实战》中的代码，有些不能实现，自己学习的时候走了很多弯路，特此分享可直接实现的代码，希望能让有需要的朋友少走弯路。

#概括性度量
import pandas as pd
import numpy as np
inputfile='../13.2/data1.csv'
data=pd.read_csv(inputfile)

r=[data.min(),data.max(),data.mean(),data.std()]
r=pd.DataFrame(r,index=['Min','Max','Mean','Std']).T

r=np.round(r,2)

#13-2 Pearson相关系数
pear=np.round(data.corr(method='pearson'),2)

#13-3 Lasso变量选择
from sklearn.linear_model import Lasso
model=Lasso(alpha=0.1)
model.fit(data.iloc[:,0:13],data['y'])
print(model.coef_)      #特征系数

#13-4  灰色预测的数据处理
from GM11 import GM11
outfile='../13.2/data1_GM11.xls'


data.index=np.arange(1994,2014,1)
data.loc[2014]=None
data.loc[2015]=None

l=['x1','x2','x3','x4','x5','x7']

for i in l:
    f=GM11(data[i][np.arange(1994,2014,1)].as_matrix())[0]
    data[i][2014]=f(len(data)-1)
    data[i][2015] = f(len(data))
    data[i]=data[i].round(2)
data[l+['y']].to_excel(outfile)

#13-5 神经网络预测模型
modelfile='../13.2/net.model'
outfile2='../13.2/revenue.xls'
data2=data[l+['y']]
data_train=data2.loc[np.arange(1994,2014,1)].copy()

data_mean=data_train.mean()
data_std=data_train.std()

data_train=(data_train-data_mean)/data_std      #数据标准化

x_train=data_train[l].as_matrix()       #特征数据
y_train=data_train['y'].as_matrix()     #标签数据

from keras.models import Sequential
from keras.layers.core import Dense,Activation

model2=Sequential()      #建立模型
model2.add(Dense(input_dim=6,units=12))
model2.add(Activation('relu'))

model2.add(Dense(input_dim=12,units=1))
model2.compile(loss='mean_squared_error',optimizer='adam')
model2.fit(x_train,y_train,epochs=10000,batch_size=16)

model2.save_weights(modelfile)

x=((data[l]-data_mean[l])/data_std[l]).as_matrix()

data2[u'y_pred']=model2.predict(x)*data_std['y']+data_mean['y']

data2.to_excel(outfile2)
import matplotlib.pyplot as plt
p=data2[['y','y_pred']].plot(subplots=True,style=['b-o','r-*'])
plt.show()

后面的一样，就不贴了

猜你喜欢

转载自blog.csdn.net/lonely2018/article/details/80184450

Python数据分析与挖掘实战 13章

《Python数据分析与挖掘实战》第13章——回归+DNN

Python数据分析与挖掘实战第10章

Python数据分析与挖掘实战 15章

Python数据分析与挖掘实战 11章

Python数据分析与挖掘实战第6章

Python数据分析与挖掘实战 12章

Python数据分析与挖掘实战第7章

Python数据分析与挖掘实战第8章

Python数据分析与挖掘实战第9章

Python数据分析与挖掘实战 14章

Python数据分析与挖掘实战——第二章

《python数据分析与挖掘实战》第二章 python数据分析简介

《Python数据分析与挖掘实战》第15章——文本挖掘

《Python数据分析与数据挖掘实战》第十五章学习——文本分析

《Python数据分析与数据挖掘实战》第十章学习——数据清洗

《Python数据分析与数据挖掘实战》第九章学习——支持向量机

《Python数据分析与数据挖掘实战》第十四章学习——层次聚类

《Python数据分析与挖掘实战》第八章学习-关联规则Apriori

《Python数据分析与挖掘实战》第七章学习——K-means聚类

《Python数据分析与挖掘实战》第14章——层次聚类

《python数据分析与挖掘实战》第12章协同过滤推荐算法程序实现

Python数据分析与挖掘实战——第一章

《Python数据分析与数据挖掘实战》第十二章学习——数据库连接+推荐

《Python数据分析与挖掘实战》第六章学习拓展——偷漏税用户识别

《python数据分析与挖掘实战》第11章应用系统负载分析与磁盘容量预测的程序实现--时间序列分析

python数据分析实战-第9章-数据分析实例气象数据

python数据分析实战-第4章-pandas库

python数据分析实战-第3章-numpy库

Python——第7章 pandas数据分析实战

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)