在python中进行t-test很简单,只需要scipy
包,不需要任何手动计算。
代码如下(为了节省空间数据只取全部数据表的前五个):
from scipy import stats
import numpy as np
import scipy.stats
request_c = np.array([30, 152, 267, 369, 478])
request_e = np.array([30, 152, 277, 383, 497])
t, pval = scipy.stats.ttest_ind(request_e, request_c)
print(t,pval)
需要注意:
scipy.stats.ttest_ind()
是双侧。如果alternative hypothesis是单侧的则需要将pval
除以二;- 用
scipy.stats.ttest_ind()
时将减数放前面,被减数放后面。这个例子中request_e
是实验组需求量,request_c
是对照组需求量,alternative hypothesis是实验组平均需求量更大,则将request_e
放前面。