参数估计(三)区间估计

区间估计的概念

对未知参数来说,我们除了关心它的点估计外,有时还需要估计出它的一个范围,以及这个范围包含参数真值的可信程度。这种范围通常用区间的形式给出,称之为置信区间。这种形式的估计就称为区间估计

设总体 X X X 的分布函数为 F ( x ; θ ) F(x;\theta) F(x;θ) θ \theta θ 为未知参数, X 1 , . . . , X n X_1,...,X_n X1,...,Xn 是来自总体 X X X 的样本。对于给定值 α ( 0 < α < 1 ) \alpha(0<\alpha<1) α(0<α<1),若存在统计量 θ ‾ ( X 1 , . . . , X n ) \underline{\theta}(X_1,...,X_n) θ(X1,...,Xn) θ ˉ ( X 1 , . . . , X n ) \bar{\theta}(X_1,...,X_n) θˉ(X1,...,Xn),使得 P { θ ‾ ( X 1 , . . . , X n ) < θ < θ ˉ ( X 1 , . . . , X n ) } ≥ 1 − α P\{\underline{\theta}(X_1,...,X_n)<\theta<\bar{\theta}(X_1,...,X_n)\} \ge 1-\alpha P{ θ(X1,...,Xn)<θ<θˉ(X1,...,Xn)}1α 则称区间 ( θ ‾ , θ ˉ ) (\underline{\theta},\bar{\theta}) (θ,θˉ) 为参数 θ \theta θ 的置信度为 1 − α 1-\alpha 1α 的置信区间, θ ‾ 、 θ ˉ \underline{\theta}、\bar{\theta} θθˉ 分别称为置信上、下限

通常可按下列思路来寻求未知参数 θ \theta θ 的置信区间:

  1. 由未知参数 θ \theta θ 的点估计量入手,构造一个仅包含样本 X 1 , . . . , X n X_1,...,X_n X1,...,Xn 和被估参数 θ \theta θ 的随机函数 G = G ( X 1 , . . . , X n ; θ ) G=G(X_1,...,X_n;\theta) G=G(X1,...,Xn;θ),其中 G G G 的概率分布应当容易确定且不含任何未知参数( G G G 也称为枢轴量);
  2. 对给定的置信度 1 − α 1-\alpha 1α,由等式 P { c < G ( X 1 , . . . , X n ; θ ) < d } = 1 − α P\{c<G(X_1,...,X_n;\theta)<d\}=1-\alpha P{ c<G(X1,...,Xn;θ)<d}=1α 适当的确定常数 c , d c,d c,d
  3. 把不等式 c < G ( X 1 , . . . , X n ; θ ) < d c<G(X_1,...,X_n;\theta)<d c<G(X1,...,Xn;θ)<d 化为等价的不等式 θ ‾ ( X 1 , . . . , X n ) < θ < θ ˉ ( X 1 , . . . , X n ) \underline{\theta}(X_1,...,X_n)<\theta<\bar{\theta}(X_1,...,X_n) θ(X1,...,Xn)<θ<θˉ(X1,...,Xn) 这样即可找到参数 θ \theta θ 的置信度为 1 − α 1-\alpha 1α 的置信区间 ( θ ‾ , θ ˉ ) (\underline{\theta},\bar{\theta}) (θ,θˉ)

上述寻求参数 θ \theta θ 的置信区间的方法称为枢轴量法

一个正态总体的情形

设总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) XN(μ,σ2) X 1 , . . . , X n X_1,...,X_n X1,...,Xn 为总体 X X X 的样本, X ˉ 、 S ∗ 2 \bar{X}、S^{*2} XˉS2 分别为样本均值和修正样本方差。下面讨论 μ , σ 2 \mu,\sigma^2 μ,σ2 的区间估计。

μ \mu μ 的区间估计

(1) 当方差 σ 2 \sigma^2 σ2 已知时,因为 X ˉ \bar{X} Xˉ μ \mu μ 的无偏估计,因此构造枢轴量 U = n ( X ˉ − μ ) σ ∼ N ( 0 , 1 ) U=\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}\sim N(0,1) U=σn (Xˉμ)N(0,1) μ \mu μ 的置信度为 1 − α 1-\alpha 1α 的置信区间为 ( X ˉ − σ n u α / 2 , X ˉ + σ n u α / 2 ) \left(\bar{X}-\frac{\sigma}{\sqrt{n}}u_{\alpha/2},\bar{X}+\frac{\sigma}{\sqrt{n}}u_{\alpha/2}\right) (Xˉn σuα/2,Xˉ+n σuα/2)

(2) 当方差 σ 2 \sigma^2 σ2 未知时,注意到 S ∗ 2 S^{*2} S2 σ 2 \sigma^2 σ2 的无偏估计,以 S ∗ S^* S 替换 (1) 中枢轴量的 σ \sigma σ,可得枢轴量 T = n ( X ˉ − μ ) S ∗ ∼ t ( n − 1 ) T=\frac{\sqrt{n}(\bar{X}-\mu)}{S^*}\sim t(n-1) T=Sn (Xˉμ)t(n1) μ \mu μ 的置信度为 1 − α 1-\alpha 1α 的置信区间为 ( X ˉ − S ∗ n t α / 2 ( n − 1 ) , X ˉ + S ∗ n t α / 2 ( n − 1 ) ) \left(\bar{X}-\frac{S^*}{\sqrt{n}}t_{\alpha/2}(n-1),\bar{X}+\frac{S^*}{\sqrt{n}}t_{\alpha/2}(n-1)\right) (Xˉn Stα/2(n1),Xˉ+n Stα/2(n1))

σ 2 \sigma^2 σ2 的区间估计

这里只讨论 μ \mu μ 未知时的 σ 2 \sigma^2 σ2 的区间估计。

因为 S ∗ 2 S^{*2} S2 σ 2 \sigma^2 σ2 的无偏估,因此构造枢轴量 χ 2 = 1 σ 2 ∑ i = 1 n ( X i − X ˉ ) 2 = ( n − 1 ) S ∗ 2 σ 2 ∼ χ 2 ( n − 1 ) \chi^2=\frac{1}{\sigma^2}\sum_{i=1}^n (X_i-\bar{X})^2=\frac{(n-1)S^{*2}}{\sigma^2} \sim \chi^2(n-1) χ2=σ21i=1n(XiXˉ)2=σ2(n1)S2χ2(n1) σ 2 \sigma^2 σ2 的置信度为 1 − α 1-\alpha 1α 的置信区间为 ( ( n − 1 ) S ∗ 2 χ α / 2 2 ( n − 1 ) , ( n − 1 ) S ∗ 2 χ 1 − α / 2 2 ( n − 1 ) ) \left(\frac{(n-1)S^{*2}}{\chi^2_{\alpha/2}(n-1)},\frac{(n-1)S^{*2}}{\chi^2_{1-\alpha/2}(n-1)}\right) (χα/22(n1)(n1)S2,χ1α/22(n1)(n1)S2)

两个正态总体的情形

设总体 X ∼ N ( μ 1 , σ 1 2 ) X \sim N(\mu_1,\sigma^2_1) XN(μ1,σ12),总体 Y ∼ N ( μ 2 , σ 2 2 ) Y \sim N(\mu_2,\sigma^2_2) YN(μ2,σ22) ( X 1 , . . . , X n 1 ) T (X_1,...,X_{n_1})^T (X1,...,Xn1)T ( Y 1 , . . . , Y n 2 ) T (Y_1,...,Y_{n_2})^T (Y1,...,Yn2)T 分别为来自总体 X 、 Y X、Y XY 的样本,且假定两样本相互独立。记 X ˉ , Y ˉ \bar{X},\bar{Y} Xˉ,Yˉ 为两样本各自的样本均值, S 1 n 1 ∗ 2 , S 2 n 2 ∗ 2 S^{*2}_{1n_1},S^{*2}_{2n_2} S1n12,S2n22 为两样本各自的修正方差。对给定的置信度 1 − α 1-\alpha 1α,要讨论 μ 1 − μ 2 ,   σ 1 2 / σ 2 2 \mu_1-\mu_2,\ \sigma_1^2/\sigma_2^2 μ1μ2, σ12/σ22 的区间估计。

μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的区间估计

(1) σ 1 2 \sigma_1^2 σ12 σ 2 2 \sigma_2^2 σ22 均已知。

构造枢轴量 U = X ˉ − Y ˉ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1) U=n1σ12+n2σ22 XˉYˉ(μ1μ2)N(0,1) μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的置信度为 1 − α 1-\alpha 1α 的置信区间为 ( ( X ˉ − Y ˉ ) ∓ u α / 2 σ 1 2 n 1 + σ 2 2 n 2 ) \left((\bar{X}-\bar{Y}) \mp u_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\right) (XˉYˉ)uα/2n1σ12+n2σ22

(2) σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2,但 σ 2 \sigma^2 σ2 未知。

构造枢轴量 T = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) T=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2) T=Swn11+n21 XˉYˉ(μ1μ2)t(n1+n22) 其中 S w = ( n 1 − 1 ) S 1 n 1 ∗ 2 + ( n 2 − 1 ) S 2 n 2 ∗ 2 n 1 + n 2 − 2 S_w=\sqrt{\frac{(n_1-1)S^{*2}_{1n_1}+(n_2-1)S^{*2}_{2n_2}}{n_1+n_2-2}} Sw=n1+n22(n11)S1n12+(n21)S2n22 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的置信度为 1 − α 1-\alpha 1α 的置信区间为 ( ( X ˉ − Y ˉ ) ∓ t α / 2 ( n 1 + n 2 − 2 ) S w 1 n 1 + 1 n 2 ) \left((\bar{X}-\bar{Y}) \mp t_{\alpha/2}(n_1+n_2-2)S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right) ((XˉYˉ)tα/2(n1+n22)Swn11+n21 )

(3) σ 1 2 \sigma_1^2 σ12 σ 2 2 \sigma_2^2 σ22 均未知,但 n 1 = n 2 = n n_1=n_2=n n1=n2=n

Z i = X i − Y i ∼ N ( μ 1 − μ 2 , σ 1 2 + σ 2 2 ) , i = 1 , 2 , . . . , n Z_i=X_i-Y_i \sim N(\mu_1-\mu_2,\sigma_1^2+\sigma_2^2),i=1,2,...,n Zi=XiYiN(μ1μ2,σ12+σ22),i=1,2,...,n,故 μ 1 − μ 2 \mu_1-\mu_2 μ1μ2 的置信度为 1 − α 1-\alpha 1α 的置信区间为 ( Z ˉ ∓ S Z ∗ n t α / 2 ( n − 1 ) ) \left(\bar{Z} \mp \frac{S_Z^*}{\sqrt{n}} t_{\alpha/2}(n-1)\right) (Zˉn SZtα/2(n1)) 其中 Z ˉ = X ˉ − Y ˉ , S Z ∗ = 1 n − 1 ∑ i = 1 n ( Z i − Z ˉ ) 2 \bar{Z}=\bar{X}-\bar{Y},S_Z^*=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (Z_i-\bar{Z})^2} Zˉ=XˉYˉ,SZ=n11i=1n(ZiZˉ)2

σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 的区间估计

这里只讨论 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 为未知时, σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 的区间估计。

构造枢轴量
F = σ 2 2 S 1 n 1 ∗ 2 σ 1 2 S 2 n 2 ∗ 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac{\sigma_2^2 S_{1n_1}^{*2}}{\sigma_1^2 S_{2n_2}^{*2}} \sim F(n_1-1,n_2-1) F=σ12S2n22σ22S1n12F(n11,n21) σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 的置信度为 1 − α 1-\alpha 1α 的置信区间为
( S 1 n 1 ∗ 2 / S 2 n 2 ∗ 2 F α / 2 ( n 1 − 1 , n 2 − 1 ) , S 1 n 1 ∗ 2 / S 2 n 2 ∗ 2 F 1 − α / 2 ( n 1 − 1 , n 2 − 1 ) ) \left(\frac{S_{1n_1}^{*2}/S_{2n_2}^{*2}}{F_{\alpha/2}(n_1-1,n_2-1)}, \frac{S_{1n_1}^{*2}/S_{2n_2}^{*2}}{F_{1-\alpha/2}(n_1-1,n_2-1)}\right) (Fα/2(n11,n21)S1n12/S2n22,F1α/2(n11,n21)S1n12/S2n22) 利用 F F F 分布上侧分位数性质,可将 σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 的置信度为 1 − α 1-\alpha 1α 的置信区间改写为
( F 1 − α / 2 ( n 2 − 1 , n 1 − 1 ) S 1 n 1 ∗ 2 S 2 n 2 ∗ 2 , F α / 2 ( n 2 − 1 , n 1 − 1 ) S 1 n 1 ∗ 2 S 2 n 2 ∗ 2 ) \left(F_{1-\alpha/2}(n_2-1,n_1-1)\frac{S_{1n_1}^{*2}}{S_{2n_2}^{*2}}, F_{\alpha/2}(n_2-1,n_1-1)\frac{S_{1n_1}^{*2}}{S_{2n_2}^{*2}}\right) (F1α/2(n21,n11)S2n22S1n12,Fα/2(n21,n11)S2n22S1n12)

参考文献

[1] 《应用数理统计》,施雨,西安交通大学出版社。

猜你喜欢

转载自blog.csdn.net/myDarling_/article/details/134629074