UA MATH564 概率论VI 数理统计基础3 卡方分布中

UA MATH564 概率论VI 数理统计基础3 卡方分布中

上一讲介绍了卡方分布的定义:假设 X 1 , , X n X_1,\cdots,X_n 互相独立,并且 X i N ( a i , 1 ) X_i \sim N(a_i,1) ,则称
i = 1 n X i 2 χ 2 ( n , δ ) \sum_{i=1}^n X_i^2 \sim \chi^2(n,\delta)
其中 n n 代表样本数, δ \delta 是非中心化参数
δ = i = 1 n a i 2 \delta = \sqrt{\sum_{i=1}^n a_i^2}
如果样本来自标准正态总体,则 δ = 0 \delta=0 ,称之为中心化的卡方分布。并推导了它的概率密度为:
k ( x n , δ ) = e δ 2 + x 2 i = 0 δ 2 i 2 i i ! x i + n / 2 1 2 i + n / 2 Γ ( i + n / 2 ) k(x|n,\delta) = e^{-\frac{\delta^2+x}{2}}\sum_{i=0}^{\infty}\frac{\delta^{2i}}{2^ii!} \frac{x^{i+n/2-1}}{2^{i+n/2}\Gamma(i+n/2)}
δ = 0 \delta=0 时,
k ( x n , 0 ) = K ( x n , 0 ) = ( 1 / 2 ) n / 2 Γ ( n / 2 ) x n 2 1 e x / 2 = d Γ ( n 2 , 1 2 ) k(x|n,0) = K'(x|n,0) = \frac{(1/2)^{n/2}}{\Gamma(n/2)}x^{\frac{n}{2}-1}e^{-x/2}=_d \Gamma(\frac{n}{2},\frac{1}{2})
下面介绍卡方分布的一些常用性质:

卡方分布的基本性质

  1. X χ 2 ( n ) X\sim \chi^2(n) ,则 E X = n ,   V a r ( X ) = 2 n EX=n,\ Var(X)=2n
  2. X n χ 2 ( n ) , n = 1 , 2 , X_n\sim \chi^2(n),n=1,2,\cdots ,则 n n \to \infty X n n 2 n d N ( 0 , 1 ) ,    2 X n 2 n d N ( 0 , 1 ) \frac{X_n-n}{\sqrt{2n}} \to_d N(0,1),\ \ \sqrt{2X_n}-\sqrt{2n} \sim_d N(0,1)
  3. Y 1 , , Y m Y_1,\cdots,Y_m 互相独立, Y i χ n i , δ i 2 Y_{i}\sim \chi^2_{n_i,\delta_i} ,则 i = 1 m Y i χ n , δ 2 ,   n = i = 1 m n i , δ 2 = i = 1 n δ i 2 \sum_{i=1}^m Y_i \sim \chi^2_{n,\delta},\ n = \sum_{i=1}^m n_i, \delta^2 = \sum_{i=1}^n \delta_i^2

用一般的正态分布构造卡方分布的方法在数理统计基础1中已经介绍过了,这里不再重复,性质1可以用gamma分布的规律直接得到,性质2的前半部分就是Classical CLT,性质3描述的是卡方分布的可加性。下面给出性质2的后半部分和性质3的证明。
证明
性质2第二个式子,考虑
P ( 2 X n 2 n x ) = P ( X n x 2 + 2 2 n x + 2 n 2 ) = P ( X n n 2 n x + x 2 2 2 n ) P(\sqrt{2X_n}-\sqrt{2n} \le x) = P(X_n \le \frac{x^2 + 2\sqrt{2n}x+2n}{2}) = P(\frac{X_n-n}{\sqrt{2n}}\le x + \frac{x^2}{2\sqrt{2n}})
n n\to \infty 时, X n n 2 n d N ( 0 , 1 ) \frac{X_n-n}{\sqrt{2n}} \to_d N(0,1) x 2 2 2 n 0 \frac{x^2}{2\sqrt{2n}} \to 0 ,因此 2 X n 2 n d N ( 0 , 1 ) \sqrt{2X_n}-\sqrt{2n} \to_d N(0,1)

性质3,中心化的卡方分布的可加性根据gamma分布的可加性可以直接得到,下面考虑非中心化的卡方分布的可加性,两两可加推广到有限可加是非常平凡的,这里证明两两可加的情况:因为 Y 1 , Y 2 Y_1,Y_2 是互相独立的,因此
f Y 1 + Y 2 ( y ) = f Y 1 f Y 2 ( y ) = z = 0 y f Y 1 ( y z ) f Y 2 ( z ) d z f_{Y_1+Y_2}(y) = f_{Y_1}*f_{Y_2}(y) = \int_{z=0}^{y}f_{Y_1}(y-z)f_{Y_2}(z)dz

经过上一讲对非中心化卡方分布的介绍,相信大家对它的密度函数已经驾轻就熟了,我们把被积函数写出来
f Y 1 ( y z ) f Y 2 ( z ) = ( e δ 1 2 + y z 2 i = 0 δ 1 2 i 2 i i ! ( y z ) i + n 1 / 2 1 2 i + n 1 / 2 Γ ( i + n 1 / 2 ) ) ( e δ 2 2 + z 2 j = 0 δ 2 2 j 2 j j ! z j + n 2 / 2 1 2 j + n 2 / 2 Γ ( j + n 2 / 2 ) ) f_{Y_1}(y-z)f_{Y_2}(z) = \left( e^{-\frac{\delta_1^2+y-z}{2}}\sum_{i=0}^{\infty}\frac{\delta_1^{2i}}{2^ii!} \frac{(y-z)^{i+n_1/2-1}}{2^{i+n_1/2}\Gamma(i+n_1/2)} \right) \left( e^{-\frac{\delta_2^2+z}{2}}\sum_{j=0}^{\infty}\frac{\delta_2^{2j}}{2^jj!} \frac{z^{j+n_2/2-1}}{2^{j+n_2/2}\Gamma(j+n_2/2)} \right)
虽然看上去很吓人但不要慌,需要的技巧我们在上一讲已经学会了——构造beta函数求积。先把上面的式子展开,
R H S = e ( δ 1 2 + δ 2 2 ) + y 2 i , j = 0 δ 1 2 i δ 2 2 j 2 i + j i ! j ! ( y z ) i + n 1 / 2 1 z j + n 2 / 2 1 2 i + j + ( n 1 + n 2 ) / 2 Γ ( i + n 1 / 2 ) Γ ( j + n 2 / 2 ) f Y 1 + Y 2 ( y ) = e ( δ 1 2 + δ 2 2 ) + y 2 i , j = 0 δ 1 2 i δ 2 2 j 2 i + j i ! j ! 0 y ( y z ) i + n 1 / 2 1 z j + n 2 / 2 1 d z 2 i + j + ( n 1 + n 2 ) / 2 Γ ( i + n 1 / 2 ) Γ ( j + n 2 / 2 ) RHS = e^{-\frac{(\delta_1^2+ \delta^2_2)+y}{2}}\sum_{i,j=0}^{\infty} \frac{\delta_1^{2i}\delta_2^{2j}}{2^{i+j}i!j!} \frac{(y-z)^{i+n_1/2-1}z^{j+n_2/2-1}}{2^{i+j+(n_1+n_2)/2}\Gamma(i+n_1/2)\Gamma(j+n_2/2)} \\ f_{Y_1+Y_2}(y) = e^{-\frac{(\delta_1^2+ \delta^2_2)+y}{2}}\sum_{i,j=0}^{\infty} \frac{\delta_1^{2i}\delta_2^{2j}}{2^{i+j}i!j!} \frac{\int_{0}^y(y-z)^{i+n_1/2-1}z^{j+n_2/2-1}dz}{2^{i+j+(n_1+n_2)/2}\Gamma(i+n_1/2)\Gamma(j+n_2/2)}

t = z / y t=z/y ,则
0 y ( y z ) i + n 1 / 2 1 z j + n 2 / 2 1 d z = y i + j + ( n 1 + n 2 ) / 2 1 0 1 ( 1 t ) i + n 1 / 2 1 t j + n 2 / 2 1 d z = y i + j + ( n 1 + n 2 ) / 2 1 B ( i + n 1 / 2 , j + n 2 / 2 ) = y i + j + ( n 1 + n 2 ) / 2 1 Γ ( i + n 1 / 2 ) Γ ( j + n 2 / 3 ) Γ ( i + j + ( n 1 + n 2 ) / 2 ) \int_{0}^y(y-z)^{i+n_1/2-1}z^{j+n_2/2-1}dz = y^{i+j+(n_1+n_2)/2-1}\int_{0}^1 (1-t)^{i+n_1/2-1}t^{j+n_2/2-1}dz \\ = y^{i+j+(n_1+n_2)/2-1}B(i+n_1/2,j+n_2/2) =y^{i+j+(n_1+n_2)/2-1}\frac{\Gamma(i+n_1/2)\Gamma(j+n_2/3)}{\Gamma(i+j+(n_1+n_2)/2)}

带回到 f Y 1 + Y 2 ( y ) f_{Y_1+Y_2}(y) 的表达式中,
f Y 1 + Y 2 ( y ) = e ( δ 1 2 + δ 2 2 ) + y 2 i , j = 0 δ 1 2 i δ 2 2 j 2 i + j i ! j ! 0 y ( y z ) i + n 1 / 2 1 z j + n 2 / 2 1 d z 2 i + j + ( n 1 + n 2 ) / 2 Γ ( i + n 1 / 2 ) Γ ( j + n 2 / 2 ) = e ( δ 1 2 + δ 2 2 ) + y 2 i , j = 0 δ 1 2 i δ 2 2 j 2 i + j i ! j ! y i + j + ( n 1 + n 2 ) / 2 1 2 i + j + ( n 1 + n 2 ) / 2 Γ ( i + j + ( n 1 + n 2 ) / 2 ) f_{Y_1+Y_2}(y) = e^{-\frac{(\delta_1^2+ \delta^2_2)+y}{2}}\sum_{i,j=0}^{\infty} \frac{\delta_1^{2i}\delta_2^{2j}}{2^{i+j}i!j!} \frac{\int_{0}^y(y-z)^{i+n_1/2-1}z^{j+n_2/2-1}dz}{2^{i+j+(n_1+n_2)/2}\Gamma(i+n_1/2)\Gamma(j+n_2/2)} \\ = e^{-\frac{(\delta_1^2+ \delta^2_2)+y}{2}}\sum_{i,j=0}^{\infty} \frac{\delta_1^{2i}\delta_2^{2j}}{2^{i+j}i!j!} \frac{y^{i+j+(n_1+n_2)/2-1}}{2^{i+j+(n_1+n_2)/2}\Gamma(i+j+(n_1+n_2)/2)}

接下来重新安排一下求和的指标,因为 { ( i , j ) : i , j = 0 , 1 , } \{(i,j):i,j=0,1,\cdots\} 的势和 { k = 0 , 1 , } \{k=0,1,\cdots\} 是一样的,不妨记 i + j = k i+j=k ,而 δ 1 2 i δ 2 2 j i ! j ! \frac{\delta_1^{2i}\delta_2^{2j}}{i! j!} 正好是多项式 ( δ 1 2 + δ 2 2 ) k (\delta_1^2 + \delta_2^2)^k 展开的第 i , j i,j 项,定义
n = i = 1 m n i , δ 2 = i = 1 n δ i 2 n = \sum_{i=1}^m n_i, \delta^2 = \sum_{i=1}^n \delta_i^2

上式可以化简为
f Y 1 + Y 2 ( y ) = e ( δ 1 2 + δ 2 2 ) + y 2 k = 0 ( δ 1 2 + δ 2 2 ) k 2 k k ! y k + ( n 1 + n 2 ) / 2 1 2 k + ( n 1 + n 2 ) / 2 Γ ( k + ( n 1 + n 2 ) / 2 ) = e δ 2 + y 2 k = 0 δ 2 k 2 k k ! y k + n / 2 1 2 k + n / 2 Γ ( k + n / 2 ) f_{Y_1+Y_2}(y) = e^{-\frac{(\delta_1^2+ \delta^2_2)+y}{2}}\sum_{k=0}^{\infty} \frac{(\delta_1^2 + \delta_2^2)^k}{2^{k}k!} \frac{y^{k+(n_1+n_2)/2-1}}{2^{k+(n_1+n_2)/2}\Gamma(k+(n_1+n_2)/2)} \\ = e^{-\frac{\delta^2+y}{2}}\sum_{k=0}^{\infty} \frac{\delta^{2k}}{2^{k}k!} \frac{y^{k+n/2-1}}{2^{k+n/2}\Gamma(k+n/2)}

显然 Y 1 + Y 2 χ n , δ 2 Y_1 + Y_2 \sim \chi^2_{n,\delta}

猜你喜欢

转载自blog.csdn.net/weixin_44207974/article/details/106680623