Pythonを使用して、複数のデータセットの分散が等しいかどうかをテストします

 2つのデータセットの平均または分散が等しいかどうかを判断するために遭遇することがあります。t検定を使用して平均が等しいかどうかを判断できます(t検定の実行方法)。分散については、 t検定を使用するよりも優れた検定方法平均が等しいかどうかを判断する方がはるかに簡単です。

 scipy.stats.levene()を使用して、テストするデータを入力するだけですが、それは1次元である必要があります。最終結果は、検定統計量とppを出力しますp値(ppの場合)p値は与えられたα\ alphaよりも小さいαしきい値の場合、これらのデータセットの分散が等しくないと判断できます。

import numpy as np
from scipy import stats

#先产生50个服从标准正态分布的样本和50个均值为0方差为4的数据
np.random.seed(2020)
data_ran = np.random.normal(0, 1, 50)
data_ran2 = np.random.normal(0, 2, 50)
#检验两组数据的方差是否相等(这两组数据的方差并不相等,因此结果应该是拒绝原假设)
r1 = stats.levene(data_ran, data_ran2)
print(r1)

出力:LeveneResult(statistic = 14.941411316215362、pvalue = 0.000019943084704952306)

 出力から、ppα\ alphaを変更しても、 p値は非常に小さいです。αは0.0010.001に設定されます0 0 0 1は、(彼らは分散の正規分布、正規分布4からの分散から来るので、あまりにも、実際には)、あなたはまだセットが等しくない二つのデータの分散を拒否することができます。

おすすめ

転載: blog.csdn.net/TSzero/article/details/111877496