Z 検定|T 検定|標本標準偏差 S が母集団標準偏差 σ に置き換わります。

Z 検定は、正規分布の標準正規分布変数検定とも呼ばれます。これは通常、サンプルが大きく (サンプル サイズが 30 を超える)、母集団の標準偏差がわかっている場合に、サンプル平均と母集団平均の差が有意かどうかを比較するために使用されます。

Z 検定の基本的な考え方は、サンプル平均と基準値または別のサンプル平均との差を計算し、それを標準正規分布の Z スコアに正規化し、最後に Z スコアを使用して p を計算することです。値を使用して、差が有意かどうかを判断します。 

Z スコア (標準スコアまたは標準化スコアとも呼ばれる) は、標準正規分布内のデータ ポイントの位置を表すスコアです。これは、データ ポイントが標準偏差の単位で平均とどの程度異なっているかを示します。 

Z テストには通常、次の 2 つの重要な前提条件が必要です。

  1. 大きなサンプル サイズ: 通常、中心極限定理が確実に成り立つようにして、サンプル平均のサンプル分布が正規分布に近づくようにするには、サンプル サイズを 30 より大きくする必要があります。

  2. 既知の母集団標準偏差: Z 検定では、母集団標準偏差がすでにわかっている必要があります。母集団の標準偏差がわからない場合、Z 検定を実行することはできません。実際の状況では、母集団の標準偏差がわからない場合は、T 検定の使用を検討できます。

これら 2 つの前提条件は、Z テストの信頼性と精度を保証することです。サンプルサイズが小さい場合、または母集団の標準偏差が不明な場合は、サンプルサイズと母集団の標準偏差に対する要件がより緩和されているため、t 検定がより適切な選択となる可能性があります。

一般に、実際の状況とサンプルデータの特性に基づいて、適切な統計検定方法を選択することが非常に重要です。

母集団標準偏差 σ の代わりに標本標準偏差 s を使用して Z 検定を実行できる場合、通常は次のような状況が発生します。

  1. 母集団の標準偏差は既知です

    • 母集団の標準偏差 σ がすでにわかっている場合は、それを直接使用して Z 検定を実行できます。この場合、母集団パラメータを推定する必要はありません。
  2. 大きなサンプルサイズ:

    • サンプルサイズが十分に大きい場合 (通常は 30 より大きい場合)、Z 検定に母集団標準偏差 σ の代わりにサンプル標準偏差 s を使用するのが合理的です。これは、標本サイズが十分に大きい場合、標本平均の標本分布は正規分布に近づくためであり、中心極限定理によれば、標本標準偏差を使用して母集団標準偏差を推定できます。
  3. 母集団が正規分布しているか、サンプル サイズが十分に大きい場合:

    • 母集団が正規分布していることがわかっている場合、または母集団が正規分布していなくてもサンプル サイズが十分に大きい場合でも、通常はサンプル標準偏差を使用して Z 検定を実行できます。これは、中心極限定理によれば、標本平均の標本分布は正規分布に近くなり、標本標準偏差を使用して統計的推論を行うことができるためです。

実際のアプリケーションでは、母集団の標準偏差が既知であるかどうか、およびサンプル サイズのサイズは特定の状況に基づいて合理的に選択する必要があることに注意してください。不確実性が存在する場合は、感度分析を実行して、さまざまな仮定の影響を評価することもできます。

一般に、Z 検定を実行するために母集団標準偏差 σ の代わりに標本標準偏差 s を使用することは、上記の条件が満たされている場合に行うことができる合理的な仮定です。

 

母集団の標準偏差が不明で、サンプル サイズが小さい (30 未満) 場合は、統計的推論に母集団の標準偏差 σ の代わりにサンプル標準偏差 s を使用できます。これは通常、t 検定などの仮説検定で発生します。

この場合、標本標準偏差の推定値により不確実性が増すため、標準正規分布ではなく t 分布を使用します。t 分布では、サンプル サイズが小さいほど、より正確な結果が得られます。

したがって、この場合、t 統計量を計算して仮説検定を実行し、t 分布表に基づいて、または統計ソフトウェアを使用して、対応する p 値を取得できます。これにより、2 つの平均間に有意な差があるかどうかを判断するなど、統計的な推論が可能になります。

import numpy as np
import statsmodels.stats.weightstats as sm

# 一个样本数据,样本容量大于30
group1 = [85, 88, 84, 82, 91, 95, 89, 90, 84, 87, 86, 82, 88, 89, 90, 85, 83, 87, 91, 92, 86, 87, 88, 89, 82, 85, 86, 87, 88, 84, 90]

# 假设的总体均值
population_mean = 85

# 执行单样本 Z 检验
z_statistic, p_value = sm.ztest(group1, value=population_mean)

# 显示结果
print(f"Z 统计量: {z_statistic}")
print(f"P 值: {p_value}")

if p_value < 0.05:
    print("在95%的置信水平下,样本均值与假设的总体均值存在显著差异")
else:
    print("在95%的置信水平下,没有足够的证据表明样本均值与假设的总体均值存在显著差异")
import numpy as np
import statsmodels.stats.weightstats as sm
# 样本数据
sample_data = [10, 12, 11, 9, 8, 10, 11, 12, 9, 10]

# 假设的总体均值
population_mean = 10

# 执行单样本 t 检验
t_statistic, p_value = sm.ttest_1samp(sample_data, population_mean)

# 显示结果
print(f"t 统计量: {t_statistic}")
print(f"P值: {p_value}")

if p_value < 0.05:
    print("在95%的置信水平下,样本均值与假设的总体均值存在显著差异")
else:
    print("在95%的置信水平下,没有足够的证据表明样本均值与假设的总体均值存在显著差异")

おすすめ

転載: blog.csdn.net/book_dw5189/article/details/132785337