python基础数据分析

单样本T检验——一个连续变量与一个数值的显著性关系
sm.stats.DescrStatsW(a[b].ttest_mean(0.1)) 0.1为参数

双样本T检验——一个分类变量(二分类)与一个连续变量的显著性关系
方差齐性检查
a1 = creditcard_exp[a[b]==0][c]
a2 = creditcard_exp[a[b]==1][c]
levene = stats.levene(a1,a2,center=‘median’)
双样本T检验
stats.stats.ttest_ind(a1,a2,equal_var=True)

方差检验——一个分类变量(多分类)与一个连续变量的显著性关系
c = list(a[b].unique()) #获取教育水平取值
edu =[]
for i in c:
edu.append(a[a[b]==i][d])
stats.f_oneway(*edu)

相关性检验——多个连续变量关系
a[[b,c]].corr(method=‘pearson’) 线性
a[[b,c]].corr(method=‘spearman’) 秩
a[[b,c]].corr(method=‘kendall’)非线性

卡方检验——两个定类变量
a= pd.read_csv(‘accepts.csv’)
z = pd.crosstab(a.b,a.c,margins=True)
x= z.div(z[‘All’],axis=0)

猜你喜欢

转载自blog.csdn.net/bigdata_zx/article/details/83956362