统计学第十五打卡:方差分析实践

from scipy import stats
import pandas as pd
import numpy as np
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
from statsmodels.stats.multicomp import pairwise_tukeyhsd
import matplotlib.pyplot as plt

car_sale_data=pd.read_csv(r'C:\Users\admin\Desktop\个人\学习\数据\统计学打卡\销售数据.csv')
car_sale_data.head()
car_sale_data_new=car_sale_data.set_index('日期').stack().reset_index()
car_sale_data_new.columns=["A","B","C"]
car_sale_data_new.head()

#1、每个地区间的销售量是否相同?
model = ols('C ~ B',car_sale_data_new).fit()
anovat = anova_lm(model)
print(anovat)

#2、不同月份的销售量是否相同?
model = ols('C ~ A',car_sale_data_new).fit()
anovat = anova_lm(model)
print(anovat)

#3、不同时间与地区的销售量是否相同?--无交互作用
model = ols('C ~ A + B',car_sale_data_new).fit()
anovat = anova_lm(model)
print(anovat)

#3、不同时间与地区的销售量是否相同?--有交互作用
model = ols('C ~ A * B + A + B',car_sale_data_new).fit()
anovat = anova_lm(model)
print(anovat)

结果如图
在这里插入图片描述
解读
1、每个地区间的销售量不相同
2、每个月的销售量相同
3、非交互作用,解读和上面两个相同;有交互作用,显示0,不知道哪里错了

发布了23 篇原创文章 · 获赞 0 · 访问量 622

猜你喜欢

转载自blog.csdn.net/macmurphy/article/details/104469698