UA MATH564 概率论VI 数理统计基础3 卡方分布中

卡方分布的基本性质

上一讲介绍了卡方分布的定义：假设 $X_1,\cdots,X_n$ 互相独立，并且 $X_i \sim N(a_i,1)$ ，则称
$\sum_{i=1}^n X_i^2 \sim \chi^2(n,\delta)$
其中 $n$ 代表样本数， $\delta$ 是非中心化参数
$\delta = \sqrt{\sum_{i=1}^n a_i^2}$
如果样本来自标准正态总体，则 $\delta=0$ ，称之为中心化的卡方分布。并推导了它的概率密度为：
$k(x|n,\delta) = e^{-\frac{\delta^2+x}{2}}\sum_{i=0}^{\infty}\frac{\delta^{2i}}{2^ii!} \frac{x^{i+n/2-1}}{2^{i+n/2}\Gamma(i+n/2)}$
当 $\delta=0$ 时，
$k(x|n,0) = K'(x|n,0) = \frac{(1/2)^{n/2}}{\Gamma(n/2)}x^{\frac{n}{2}-1}e^{-x/2}=_d \Gamma(\frac{n}{2},\frac{1}{2})$
下面介绍卡方分布的一些常用性质：

卡方分布的基本性质

$X\sim \chi^2(n)$ ，则 $EX=n,\ Var(X)=2n$
$X_n\sim \chi^2(n),n=1,2,\cdots$ ，则 $n \to \infty$ ， $\frac{X_n-n}{\sqrt{2n}} \to_d N(0,1),\ \ \sqrt{2X_n}-\sqrt{2n} \sim_d N(0,1)$
$Y_1,\cdots,Y_m$ 互相独立， $Y_{i}\sim \chi^2_{n_i,\delta_i}$ ，则 $\sum_{i=1}^m Y_i \sim \chi^2_{n,\delta},\ n = \sum_{i=1}^m n_i, \delta^2 = \sum_{i=1}^n \delta_i^2$

用一般的正态分布构造卡方分布的方法在数理统计基础1中已经介绍过了，这里不再重复，性质1可以用gamma分布的规律直接得到，性质2的前半部分就是Classical CLT，性质3描述的是卡方分布的可加性。下面给出性质2的后半部分和性质3的证明。
证明
性质2第二个式子，考虑
$P(\sqrt{2X_n}-\sqrt{2n} \le x) = P(X_n \le \frac{x^2 + 2\sqrt{2n}x+2n}{2}) = P(\frac{X_n-n}{\sqrt{2n}}\le x + \frac{x^2}{2\sqrt{2n}})$
当 $n\to \infty$ 时， $\frac{X_n-n}{\sqrt{2n}} \to_d N(0,1)$ ， $\frac{x^2}{2\sqrt{2n}} \to 0$ ，因此 $\sqrt{2X_n}-\sqrt{2n} \to_d N(0,1)$

性质3，中心化的卡方分布的可加性根据gamma分布的可加性可以直接得到，下面考虑非中心化的卡方分布的可加性，两两可加推广到有限可加是非常平凡的，这里证明两两可加的情况：因为 $Y_1,Y_2$ 是互相独立的，因此
$f_{Y_1+Y_2}(y) = f_{Y_1}*f_{Y_2}(y) = \int_{z=0}^{y}f_{Y_1}(y-z)f_{Y_2}(z)dz$

经过上一讲对非中心化卡方分布的介绍，相信大家对它的密度函数已经驾轻就熟了，我们把被积函数写出来
$f_{Y_1}(y-z)f_{Y_2}(z) = \left( e^{-\frac{\delta_1^2+y-z}{2}}\sum_{i=0}^{\infty}\frac{\delta_1^{2i}}{2^ii!} \frac{(y-z)^{i+n_1/2-1}}{2^{i+n_1/2}\Gamma(i+n_1/2)} \right) \left( e^{-\frac{\delta_2^2+z}{2}}\sum_{j=0}^{\infty}\frac{\delta_2^{2j}}{2^jj!} \frac{z^{j+n_2/2-1}}{2^{j+n_2/2}\Gamma(j+n_2/2)} \right)$
虽然看上去很吓人但不要慌，需要的技巧我们在上一讲已经学会了——构造beta函数求积。先把上面的式子展开，
$RHS = e^{-\frac{(\delta_1^2+ \delta^2_2)+y}{2}}\sum_{i,j=0}^{\infty} \frac{\delta_1^{2i}\delta_2^{2j}}{2^{i+j}i!j!} \frac{(y-z)^{i+n_1/2-1}z^{j+n_2/2-1}}{2^{i+j+(n_1+n_2)/2}\Gamma(i+n_1/2)\Gamma(j+n_2/2)} \\ f_{Y_1+Y_2}(y) = e^{-\frac{(\delta_1^2+ \delta^2_2)+y}{2}}\sum_{i,j=0}^{\infty} \frac{\delta_1^{2i}\delta_2^{2j}}{2^{i+j}i!j!} \frac{\int_{0}^y(y-z)^{i+n_1/2-1}z^{j+n_2/2-1}dz}{2^{i+j+(n_1+n_2)/2}\Gamma(i+n_1/2)\Gamma(j+n_2/2)}$

令 $t=z/y$ ，则
$\int_{0}^y(y-z)^{i+n_1/2-1}z^{j+n_2/2-1}dz = y^{i+j+(n_1+n_2)/2-1}\int_{0}^1 (1-t)^{i+n_1/2-1}t^{j+n_2/2-1}dz \\ = y^{i+j+(n_1+n_2)/2-1}B(i+n_1/2,j+n_2/2) =y^{i+j+(n_1+n_2)/2-1}\frac{\Gamma(i+n_1/2)\Gamma(j+n_2/3)}{\Gamma(i+j+(n_1+n_2)/2)}$

带回到 $f_{Y_1+Y_2}(y)$ 的表达式中，
$f_{Y_1+Y_2}(y) = e^{-\frac{(\delta_1^2+ \delta^2_2)+y}{2}}\sum_{i,j=0}^{\infty} \frac{\delta_1^{2i}\delta_2^{2j}}{2^{i+j}i!j!} \frac{\int_{0}^y(y-z)^{i+n_1/2-1}z^{j+n_2/2-1}dz}{2^{i+j+(n_1+n_2)/2}\Gamma(i+n_1/2)\Gamma(j+n_2/2)} \\ = e^{-\frac{(\delta_1^2+ \delta^2_2)+y}{2}}\sum_{i,j=0}^{\infty} \frac{\delta_1^{2i}\delta_2^{2j}}{2^{i+j}i!j!} \frac{y^{i+j+(n_1+n_2)/2-1}}{2^{i+j+(n_1+n_2)/2}\Gamma(i+j+(n_1+n_2)/2)}$

接下来重新安排一下求和的指标，因为 $\{(i,j):i,j=0,1,\cdots\}$ 的势和 $\{k=0,1,\cdots\}$ 是一样的，不妨记 $i+j=k$ ，而 $\frac{\delta_1^{2i}\delta_2^{2j}}{i! j!}$ 正好是多项式 $(\delta_1^2 + \delta_2^2)^k$ 展开的第 $i,j$ 项，定义
$n = \sum_{i=1}^m n_i, \delta^2 = \sum_{i=1}^n \delta_i^2$

上式可以化简为
$f_{Y_1+Y_2}(y) = e^{-\frac{(\delta_1^2+ \delta^2_2)+y}{2}}\sum_{k=0}^{\infty} \frac{(\delta_1^2 + \delta_2^2)^k}{2^{k}k!} \frac{y^{k+(n_1+n_2)/2-1}}{2^{k+(n_1+n_2)/2}\Gamma(k+(n_1+n_2)/2)} \\ = e^{-\frac{\delta^2+y}{2}}\sum_{k=0}^{\infty} \frac{\delta^{2k}}{2^{k}k!} \frac{y^{k+n/2-1}}{2^{k+n/2}\Gamma(k+n/2)}$

显然 $Y_1 + Y_2 \sim \chi^2_{n,\delta}$

UA MATH564 概率论VI 数理统计基础3 卡方分布中

UA MATH564 概率论VI 数理统计基础3 卡方分布中

卡方分布的基本性质

猜你喜欢