如何确定假设检验的样本量（sample size）？

在《如何计算假设检验的功效（power）和效应量（effect size）？》一文中，我们讲述了如何根据显著性水平α，效应量和样本容量n，计算功效，以及如何根据显著性水平α，功效和样本容量n，计算效应量。但这两个应用都属于事后检验，也就是说，就算假设检验之后计算出的功效或效应量不理想，我们也没有办法改变。因此，我们最好事先就把我们想要达到的功效和效应量确定好，然后根据显著性水平α，功效和效应量，计算样本容量n。这种事前检验的应用用得比较多。

此外，我们都知道，如果假设检验选取的样本量很小，那么检验结果的可信度就不高，因为每次抽取的样本波动会很大。但是也不是说样本量越大越好，因为如果样本量很大的话，会增加检验的成本。因此，假设检验之前就要确定好样本量。

样本量（sample size）：每次抽取的样本中所含的观测值的数量。

z检验（均值）中计算样本量的公式如下：

（单尾）

（双尾）

注：μ_a为第二类错误中所采用的总体均值的值。

应用：根据显著性水平α，功效和效应量，计算样本容量n。

（可用G*Power或Statsmodels计算）

如何使用G*Power：https://zhuanlan.zhihu.com/p/62560195

线上计算：https://www.stat.ubc.ca/~rollin/stats/ssize/n2.html

单样本t检验：statsmodels.stats.power.tt_solve_power(effect_size=None, nobs=None, alpha=None, power=None, alternative='two-sided')

独立样本t检验：statsmodels.stats.power.tt_ind_solve_power(effect_size=None, nobs1=None, alpha=None, power=None, ratio=1.0, alternative='two-sided')

卡方拟合优度检验：statsmodels.stats.power.GofChisquarePower.solve_power(effect_size=None, nobs=None, alpha=None, power=None, n_bins=2)

F方差齐性检验：statsmodels.stats.power.FTestPower.solve_power(effect_size=None, df_num=None, df_denom=None, nobs=None, alpha=None, power=None, ncc=1)

方差分析：statsmodels.stats.power.FTestAnovaPower.solve_power(effect_size=None, nobs=None, alpha=None, power=None, k_groups=2)

可以看到，用Statsmodels库计算功效，效应量和样本量的函数都是同一个，只要把需要计算的那个值仍然设为None，把其他想要达到的数值填上即可。

参考：

https://www.afenxi.com/23249.html

如何确定假设检验的样本量（sample size）？

猜你喜欢