数据挖掘之回归分析

本博客根据非常好的excel资料而编写,使用python语言操作,预计使用一周的时间更新完成。需要《非常好的excel资料》word文档,欢迎发邮件给[email protected],免费发放。这篇博客对应《非常好的excel资料》里的第6章节。

1.1 一元线性回归分析

①数据
在这里插入图片描述
python操作

import pandas as pd
ex61=pd.read_csv('D:\ins61.csv',encoding='gbk')
x =pd.to_numeric(ex61['X'][0:26])
y = pd.to_numeric(ex61['Y'][0:26])
from statsmodels.formula.api import ols
import pandas as pd
data = pd.DataFrame({'x':x, 'y':y})
model = ols('y~x', data).fit()
print(model.summary())

结果图
在这里插入图片描述

1.2 多元线性回归分析

数据

在这里插入图片描述
python代码

import pandas as pd
import numpy as np
import statsmodels.api as sm
from pandas import DataFrame
ex61=pd.read_csv('D:\ins61.csv',encoding='gbk')
y=pd.to_numeric(ex61['Y1'][0:15])
X=ex61[['X1','X2','X3','X4']][0:15]
X=pd.DataFrame(X,dtype=np.float)  #将dataframe里的值转成float
#y=pd.to_numeric(ex61['Y1'])
X=sm.add_constant(X)
est=sm.OLS(y,X).fit()
est.summary()

结果图
在这里插入图片描述
可以看出Y = 1.454409X1+0.549593X2+0.067714X3-0.08167X4+59.68807
因为90.99643>8.02×〖10〗^8 ,所以多元线性回归显著。
上一篇:数据挖掘之方差分析实验
下一篇:数据挖掘之多元线性回归练习题

猜你喜欢

转载自blog.csdn.net/qq_31089125/article/details/84872735
今日推荐