正規分布
正規分布は、二項分布の漸近公式で Dimove によって初めて得られ、その地位を実際に確立したのはガウスの測定誤差に関する研究であるため、ガウス分布とも呼ばれます。。計測は人間が自然界を定量的に理解するための基礎であり、計測誤差の普遍性により正規分布の応用範囲が広いためか、正規分布は分布系図において中核的な位置を占めています。
正規分布N ( μ , σ ) N(\mu, \sigma)N ( μ ,σ )期待値の影響を受けるμ \muμと分散σ 2 \sigma^2p2規制の場合、その確率密度関数は
1 2 π σ 2 exp [ − ( x − μ ) 2 2 σ 2 ] \frac{1}{\sqrt{2\pi\sigma^2}}\exp[-\frac{(x-\mu) ^2}{2\sigma^2}]2本_21exp [ −2P _2( ×−メートル)2】
当μ = 0 \mu=0メートル=0およびσ = 1 \sigma=1p=1の場合、標準正規分布N ( 0 , 1 ) N(0,1)N ( 0 ,1 )、対応する確率分布関数はΦ ( x ) = 1 2 π exp [ − x 2 2 ] \Phi(x)=\frac{1}{\sqrt{2\pi}}\exp[-\フラク{x^2}{2}]Φ ( × )=午後2時1exp [ −2バツ2]。
カイ二乗分布
だったらk 個の独立確率変数ξ 1 、 ξ 2 、 ⋯ 、 ξ k \xi_1, \xi_2,\cdots,\xi_kバツ1、バツ2、⋯、バツk、すべてが標準正規分布に従う場合、これらの k 個の確率変数の二乗和が新しい変数を構成し、新しい変数はχ 2 \chi^2に従います。h2配布。その確率密度関数は次のとおりです。
ρ ( x ) = ( 1 / 2 ) k / 2 Γ ( k / 2 ) xk / 2 − 1 e − x / 2 \rho(x)=\frac{(1/2)^{k/2}} {\Gamma(k/2)}x^{k/2-1}e^{-x/2}p ( x )=C ( k /2 )( 1/2 )k / 2バツk /2 − 1 e− × /2
次に、kkを構築することで、正規分布に従ってk 個の確率変数を計算し、それらの二乗和をプロットします。
import numpy as np
from scipy.stats import norm, chi2
import matplotlib.pyplot as plt
k = 200
xs = [np.sum(norm.rvs(size=200)**2) for _ in range(10000)]
plt.hist(xs, density=True, bins=100, alpha=0.8)
rv = chi2(k)
st, ed = rv.interval(0.995)
xs = np.linspace(st, ed, 200)
plt.plot(xs, rv.pdf(xs))
plt.show()
効果は
カイ二乗分布の極限
カイ二乗分布の PDF はkkの対象となりますkの調整、 kk付きkの値は増加し続け、カイ二乗分布は正規分布に近づきます。さらに、カイ二乗分布の一般的に使用される統計的特性もkkkは密接に関連しており、その期待値はkkk、分散は2 k 2k2 k、中央値はk − 3 2 k-\frac 3 2k−23近く。
以下のkkをそれぞれ変更してくださいk値。カイ二乗分布の乱数のセットを生成します。期待値はkkk、標準偏差はk 2 \sqrt{\frac k2}2k比較のための正規分布曲線。
fig = plt.figure()
for i,k in enumerate([1,10,100,1000]):
ax = fig.add_subplot(2,2,i+1)
chis = chi2(k).rvs(size=10000) # 卡方分布
ax.hist(chis, density=True, bins=100, alpha=0.8)
rv = norm(k, np.sqrt(2*k))
st, ed = rv.interval(0.995)
xs = np.linspace(st, ed, 200)
ax.plot(xs, rv.pdf(xs))
ax.set_title(f"k={
k}")
plt.show()
結果は次のとおりです。kk を使用すると、次のことがわかります。k が徐々に増加するにつれて、カイ二乗分布は正規分布に近づきます。