UA MATH564 概率论VI 数理统计基础3 卡方分布中
上一讲介绍了卡方分布的定义:假设
X1,⋯,Xn互相独立,并且
Xi∼N(ai,1),则称
i=1∑nXi2∼χ2(n,δ)
其中
n代表样本数,
δ是非中心化参数
δ=i=1∑nai2
如果样本来自标准正态总体,则
δ=0,称之为中心化的卡方分布。并推导了它的概率密度为:
k(x∣n,δ)=e−2δ2+xi=0∑∞2ii!δ2i2i+n/2Γ(i+n/2)xi+n/2−1
当
δ=0时,
k(x∣n,0)=K′(x∣n,0)=Γ(n/2)(1/2)n/2x2n−1e−x/2=dΓ(2n,21)
下面介绍卡方分布的一些常用性质:
卡方分布的基本性质
-
X∼χ2(n),则
EX=n, Var(X)=2n
-
Xn∼χ2(n),n=1,2,⋯,则
n→∞,
2n
Xn−n→dN(0,1), 2Xn
−2n
∼dN(0,1)
-
Y1,⋯,Ym互相独立,
Yi∼χni,δi2,则
i=1∑mYi∼χn,δ2, n=i=1∑mni,δ2=i=1∑nδi2
用一般的正态分布构造卡方分布的方法在数理统计基础1中已经介绍过了,这里不再重复,性质1可以用gamma分布的规律直接得到,性质2的前半部分就是Classical CLT,性质3描述的是卡方分布的可加性。下面给出性质2的后半部分和性质3的证明。
证明
性质2第二个式子,考虑
P(2Xn
−2n
≤x)=P(Xn≤2x2+22n
x+2n)=P(2n
Xn−n≤x+22n
x2)
当
n→∞时,
2n
Xn−n→dN(0,1),
22n
x2→0,因此
2Xn
−2n
→dN(0,1)
性质3,中心化的卡方分布的可加性根据gamma分布的可加性可以直接得到,下面考虑非中心化的卡方分布的可加性,两两可加推广到有限可加是非常平凡的,这里证明两两可加的情况:因为
Y1,Y2是互相独立的,因此
fY1+Y2(y)=fY1∗fY2(y)=∫z=0yfY1(y−z)fY2(z)dz
经过上一讲对非中心化卡方分布的介绍,相信大家对它的密度函数已经驾轻就熟了,我们把被积函数写出来
fY1(y−z)fY2(z)=(e−2δ12+y−zi=0∑∞2ii!δ12i2i+n1/2Γ(i+n1/2)(y−z)i+n1/2−1)(e−2δ22+zj=0∑∞2jj!δ22j2j+n2/2Γ(j+n2/2)zj+n2/2−1)
虽然看上去很吓人但不要慌,需要的技巧我们在上一讲已经学会了——构造beta函数求积。先把上面的式子展开,
RHS=e−2(δ12+δ22)+yi,j=0∑∞2i+ji!j!δ12iδ22j2i+j+(n1+n2)/2Γ(i+n1/2)Γ(j+n2/2)(y−z)i+n1/2−1zj+n2/2−1fY1+Y2(y)=e−2(δ12+δ22)+yi,j=0∑∞2i+ji!j!δ12iδ22j2i+j+(n1+n2)/2Γ(i+n1/2)Γ(j+n2/2)∫0y(y−z)i+n1/2−1zj+n2/2−1dz
令
t=z/y,则
∫0y(y−z)i+n1/2−1zj+n2/2−1dz=yi+j+(n1+n2)/2−1∫01(1−t)i+n1/2−1tj+n2/2−1dz=yi+j+(n1+n2)/2−1B(i+n1/2,j+n2/2)=yi+j+(n1+n2)/2−1Γ(i+j+(n1+n2)/2)Γ(i+n1/2)Γ(j+n2/3)
带回到
fY1+Y2(y)的表达式中,
fY1+Y2(y)=e−2(δ12+δ22)+yi,j=0∑∞2i+ji!j!δ12iδ22j2i+j+(n1+n2)/2Γ(i+n1/2)Γ(j+n2/2)∫0y(y−z)i+n1/2−1zj+n2/2−1dz=e−2(δ12+δ22)+yi,j=0∑∞2i+ji!j!δ12iδ22j2i+j+(n1+n2)/2Γ(i+j+(n1+n2)/2)yi+j+(n1+n2)/2−1
接下来重新安排一下求和的指标,因为
{(i,j):i,j=0,1,⋯}的势和
{k=0,1,⋯}是一样的,不妨记
i+j=k,而
i!j!δ12iδ22j正好是多项式
(δ12+δ22)k展开的第
i,j项,定义
n=i=1∑mni,δ2=i=1∑nδi2
上式可以化简为
fY1+Y2(y)=e−2(δ12+δ22)+yk=0∑∞2kk!(δ12+δ22)k2k+(n1+n2)/2Γ(k+(n1+n2)/2)yk+(n1+n2)/2−1=e−2δ2+yk=0∑∞2kk!δ2k2k+n/2Γ(k+n/2)yk+n/2−1
显然
Y1+Y2∼χn,δ2