Python统计学:如何理解单样本t检验?

单样本的t检验 指样本的均值是否某个值存在差异。

比如一包薯片标的克重为50g,但每包不一定都是50g,那么我们可以对薯片进行随机抽样,检验它与50g是否有差异。


1 提出假设:

原假设:薯片的平均重量是50g;

备择假设:薯片的平均重量不是50g。

如果检验薯片是否小于50g是单侧检验,检验薯片是否和50g存在差异是双侧检验。


2 定显著性水平:

对精度要求不太高,显著性水平一般用0.05,我们计算出p值之后,要与显著性水平进行比较,如果返回的p值小于显著性水平,则拒绝零假设,即认为样本数据与总体均值有显著差异。


3 导入样本数据:

junk_food = [58.530, 52.353, 74.446, 52.983, 55.877, 67.660, 47.726, 50.267, 56.501, 52.361, 45.458, 53.361, 52.129, 59.828, 41.682, 49.399, 64.211, 69.859, 42.911, 60.159]

junk_food


4 对样本数据进行t检验:

# t检验

stats.ttest_1samp(junk_food, 50)

代码详解: 

scipy库中的ttest_1samp函数,可以用来进行样本t检验;

50代表假设的总体均值;

返回的结果statistic代表t值,pvalue代表p值;

结果是返回的p值0.0127小于显著性水平0.05,所以我们拒绝原假设,即认为样本数据与总体均值有显著差异。也即认为薯片的重量与50g存在显著性差异。

猜你喜欢

转载自blog.csdn.net/Sukey666666/article/details/130257479