UA MATH564 概率论VI 数理统计基础4 t分布
t分布的定义
假设
X,Y互相独立,
X∼N(δ,1),
Y∼χn2,则
Z=Y/n
X∼tn,δ
其中
n被称为自由度,
δ为非中心参数,
δ=0称为中心化的t分布,简称t分布。下面计算t分布的CDF与PDF并介绍几个常用性质。
t分布的概率密度
记
Z的概率密度为
s(x∣n,δ),分布函数为
S(x∣n,δ)。
引理1 假设
X,Y互相独立,概率密度分别为
g(x),h(y),
Y>0,a.s.,
Z=X/Y,则
fZ(z)=∫0∞tg(tz)h(t)dt, FZ(z)=∫0∞G(tz)h(t)dt,∀z∈R
证明
FZ(z)=P(Z≤z)=P(YX≤z)=P(X≤zY)=∫x≤zyg(x)h(y)dxdy=∫0∞h(y)dy∫−∞zyg(x)dx=∫0∞G(zy)h(y)dyfZ(z)=FZ′(z)=∫0∞G′(zy)h(y)dy=∫0∞zg(zy)h(y)dy
证毕
下面分别考虑
X与
Y/n
的分布。
X∼N(δ,1),因此
g(x)=2π
1exp(−2(x−δ)2)=2π
1e−2x2+δ2e−δx
类似我们在计算卡方分布时的处理,将
e−δx展开为级数,
g(x)=2π
1e−2x2+δ2i=0∑∞i!(δx)i
因为
Y∼χn2,记
W=Y/n
,则
HW(w)=P(W≤w)=P(Y/n
≤w)=P(Y≤nw2)=FY(nw2)hW(w)=FW′(w)=2nwfY(nw2)=2nwΓ(n/2)(1/2)n/2(nw2)2n−1e−nw2/2=22n−1Γ(2n)n2nwn−1e−2nw2,w>0
下面根据引理1计算t分布的概率密度:
s(z∣n,δ)=∫0∞zg(zy)h(y)dy=∫0∞z22n−1Γ(2n)n2nyn−1e−2ny22π
1e−2(zy)2+δ2i=0∑∞i!(δzy)idy=z22n−1Γ(2n)n2n2π
1e−2δ2i=0∑∞i!δizi∫0∞yi+n−1e−2n+z2y2dy
这里需要用到Gamma函数求积技巧:
∫0∞yi+n−1e−2n+z2y2dy=n+z21∫0∞yi+n−2e−2n+z2y2d(2n+z2y2)=(n+z2)2i+n22i+n−2∫0∞(2n+z2y2)2i+n−2e−2n+z2y2d(2n+z2y2)=(n+z2)2i+n22i+n−2Γ(2n+i)
带入概率密度并化简:
s(z∣n,δ)=π
Γ(2n)n2n(n+z2)2n+1e−2δ2i=0∑∞2i!(n+i+1)(δz)i(n+z22)2i
当
δ=0时,
s(z∣n,0)=nπ
Γ(2n)Γ(2n+1)(1+nz2)−2n+1
t分布的性质
性质1:
X1,⋯,Xn∼iidN(μ,σ2),
Z=n−11∑i=1n(Xi−Xˉ)2
n
(Xˉ−b)∼tn−1,δ,
δ=σn
(μ−b)
性质2:
X1,⋯,Xm∼iidN(a,σ2),Y1,⋯,Yn∼iidN(b,σ2),他们均互相独立,则
Z=m+nmn(m+n−2)
∑i=1m(Xi−Xˉ)2+∑j=1n(Yj−Yˉ)2
Xˉ−Yˉ−c∼tm+n−2,δ
其中
δ=m+nmn
σa−b−c
性质3:
Xn∼tn,δ,则
Xn→dN(δ,1)
性质1和性质2都比较简单,性质1是单总体正态均值的t检验的基础;性质2是双总体正态均值的t检验的基础。性质1中,对
Z做简单变形:
Z=n−11∑i=1n(Xi−Xˉ)2
n
(Xˉ−b)=n−11∑i=1n(σXi−μ−σXˉ−μ)2
σn
(Xˉ−b)
分子
σn
(Xˉ−b)∼N(σn
(μ−b),1),并且与分母互相独立;数理统计基础1中已经证明了分母是服从
χn−12的。性质2的证明方法与性质1类似。下面证明性质3:
证明 定义+大数定律
根据定义,
Xn可以写成
Z/n1∑i=1nYi2
,其中
Z∼N(δ,1)且与所有的
Yi独立,
Y1,⋯,Yn∼iidN(0,1),根据弱大数定律
n1i=1∑nYi2→PE[Y12]=1
因此当
n→∞时,
Xn→dZ∼N(δ,1)。