统计假设检验

1 假设检验基本思想

假设检验是由K. Pearson于20世纪提出的,之后由费希尔(Fisher)进行了细化,并最终由奈曼和E. Pearson提出了较完整的假设检验理论。假设检验的基本思想是“小概率事件”原理,其统计推断方法是带有某种概率性质的反证法。小概率思想是指小概率事件在一次试验中基本上不会发生。反证思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。即为了检验一个假设 H 0 \mathrm{H}_0 H0会否正确,首先假定该假设 H 0 \mathrm{H}_0 H0正确,然后根据样本对假设 H 0 \mathrm{H}_0 H0做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”的发生,就应该拒绝假设 H 0 \mathrm{H}_0 H0,否则不拒绝假设 H 0 \mathrm{H}_0 H0

2 假设检验步骤

下面用一个实例引出假设检验中的一些基本概念和操作步骤。

某厂生产的合金强度服从正态分布 N ( θ , 16 ) N(\theta,16) N(θ,16),其中 θ \theta θ的设计值为不低于 110 110 110帕。为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常执行,即该合金的平均强度不低于 110 110 110帕。从生产的产品中随机抽取 25 25 25块合金,测得其强度值为 x 1 , ⋯   , x 25 x_1,\cdots,x_{25} x1,,x25,均值为 x ˉ = 108.2 \bar{x}=108.2 xˉ=108.2帕,问当日生产是否正常?

对这个实际问题可做如下分析:
(1)这不是一个参数估计问题。
(2)这是在给定总体与样本下,要求对命题“合金强度不低于 110 110 110帕”作出回答:“是”还是“否”?这类问题称为统计假设检验问题,简称假设检验问题。
(3)命题:“合金平均强度不低于 110 110 110帕”仅涉及参数 θ \theta θ范围,因此该命题是否正确将涉及如下两个参数集合: Θ 0 = { θ : θ ≥ 110 } , Θ 1 = { θ : θ < 110 } \Theta_0=\{\theta:\theta\ge 110\},\quad\quad\quad\quad\Theta_1=\{\theta:\theta<110\} Θ0={ θ:θ110},Θ1={ θ:θ<110}命题成立对应于“ θ ∈ Θ 0 \theta\in \Theta_0 θΘ0”,命题不成立则对应“ θ ∈ Θ 1 \theta\in\Theta_1 θΘ1”。在统计学中这两个非空不相交参数集合都称作统计假设,简称假设。
(4)假设检验的任务是利用所给总体 N ( θ , 16 ) N(\theta,16) N(θ,16)和样本均值 x ˉ = 108.2 \bar{x}=108.2 xˉ=108.2帕去判断假设命题“ θ ∈ Θ 0 \theta \in \Theta_0 θΘ0”是否成立。通过样本对一个假设做出“对”或“不对”的具体判断规则称为该假设的一个检验或检验法则。检验的结果若是肯定该命题,则称接受这个假设,否则就称为拒绝该假设。这里的“接受”或“拒绝”一个假设的行为,只是反映了当事者在给定样本之下对该命题所采取的一种态度,一种行为,而不是从逻辑上或理论上“证明”该命题正确与否。因为所采用的样本是随机的,所以所作的判断也可能是错误的。
(5)若假设可用一个参数的集合表示,该假设检验问题称为参数假设检验问题,否则称为非参数假设检验问题。

2.1 建立假设

对于参数假设检验问题,设有来自某一个参数分布族 { F ( x , θ ) ∣ θ ∈ Θ } \{F(x,\theta)|\theta \in \Theta\} { F(x,θ)θΘ}的样本 x 1 , ⋯   , x n x_1,\cdots,x_n x1,,xn,其中 Θ \Theta Θ为参数空间,设 Θ 0 ∈ Θ \Theta_0\in \Theta Θ0Θ,且 Θ 0 ≠ ∅ \Theta_0\ne \varnothing Θ0=,则命题 H 0 : θ ∈ Θ 0 \mathrm{H}_0:\theta \in \Theta_0 H0:θΘ0称为一个假设或原假设或零假设,若有另一个 Θ 1 \Theta_1 Θ1 Θ 1 ⊂ Θ , Θ 1 Θ 0 = ∅ \Theta_1 \subset \Theta,\Theta_1\Theta_0=\varnothing Θ1Θ,Θ1Θ0=,常见的一种情况是 Θ 1 = Θ − Θ 0 \Theta_1=\Theta-\Theta_0 Θ1=ΘΘ0),则命题 H 1 : θ ∈ Θ 1 \mathrm{H}_1:\theta\in \Theta_1 H1:θΘ1称为 H 0 \mathrm{H}_0 H0的对立假设或备择假设,即 H 0 : θ ∈ Θ 0 v s H 1 : θ ∈ Θ 1 \mathrm{H}_0:\theta\in \Theta_0\quad\quad\quad\mathrm{vs}\quad\quad\quad\mathrm{H}_1:\theta\in\Theta_1 H0:θΘ0vsH1:θΘ1 H 0 : θ = θ 0 \mathrm{H}_0:\theta=\theta_0 H0:θ=θ0时,则备择假设通常有是三种可能: H 1 ′ : θ ≠ θ 0 , H 1 ′ ′ : θ < θ 0 , H 1 ′ ′ ′ : θ > θ 0 \mathrm{H}_1^{\prime}:\theta\ne \theta_0,\quad \mathrm{H}_1^{\prime\prime}:\theta<\theta_0,\quad \mathrm{H}_1^{\prime\prime\prime}:\theta>\theta_0 H1:θ=θ0,H1′′:θ<θ0,H1′′′:θ>θ0则称 H 0   v s   H 1 ′ \mathrm{H}_0\text{ }vs\text{ }\mathrm{H}_1^\prime H0 vs H1为双侧假设或双边假设, H 0   v s   H 1 ′ ′ \mathrm{H}_0\text{ }vs\text{ }\mathrm{H}_1^{\prime\prime} H0 vs H1′′以及 H 0   v s   H 1 ′ ′ ′ \mathrm{H}_0\text{ }vs\text{ }\mathrm{H}_1^{\prime\prime\prime} H0 vs H1′′′为单侧假设或单边假设。一般情况下,“ = = =”需要放在原假设里。对于以上实例,可以建立如下一对假设 H 0 : θ ∈ Θ = { θ ∣ θ ≥ 110 } v s H 1 : θ ∈ Θ = { θ ∣ θ < 110 } \mathrm{H}_0:\theta\in\Theta=\{\theta|\theta\ge110\}\quad \mathrm{vs}\quad \mathrm{H}_1:\theta\in\Theta=\{\theta|\theta<110\} H0:θΘ={ θθ110}vsH1:θΘ={ θθ<110}

2.2 检验统计量

当有了具体的样本后,按该法则就可以决定是接受 H 0 \mathrm{H}_0 H0还是拒绝 H 0 \mathrm{H}_0 H0,即检验就等价于把样本空间划分成两个互不相关的部分 W W W W ‾ \overline{W} W,当样本属于 W W W时,拒绝 H 0 \mathrm{H}_0 H0;否则接受 H 0 \mathrm{H}_0 H0。于是则称 W W W为该检验的拒绝域,而 W ‾ \overline{W} W称为接受域。由样本对原假设进行检验总是通过一个统计量完成的,该统计量称为检验统计量。在以上实例中,样本均值 x ˉ \bar{x} xˉ就是一个检验统计量,因为要检验的假设是正态总体均值,在方差已知的场合,样本均值 x ˉ \bar{x} xˉ是总体均值的充分统计量。当样本均值 x ˉ \bar{x} xˉ越大时,意味着总体均值 θ \theta θ也越大;样本均值 x ˉ \bar{x} xˉ越小时,意味着总体均值 θ \theta θ也越小,所以拒绝域的形式如下所示: W = { ( x 1 , ⋯   , w n ) ∣ x ˉ ≤ c } W=\{(x_1,\cdots,w_n)|\bar{x}\le c\} W={(x1,,wn)xˉc}其中 c c c是临界值。

2.3 选择显著性水平

由于样本是随机的,故当应用某种检验做判断时,可能做出正确的判断,也可能做出错误判断。因此,可能犯如下两种错误:当 θ ∈ Θ 0 \theta\in \Theta_0 θΘ0时,样本由于随机性却落入了拒绝域 W W W,于是采取了拒绝 H 0 \mathrm{H}_0 H0的错误决策,此时称这样的错误为第一类错误,计算公式为 α = P θ { X ∈ W ∣ H 0 } \alpha=P_\theta\{X\in W| \mathrm{H}_0\} α=Pθ{ XWH0} θ ∈ Θ 1 \theta\in\Theta_1 θΘ1时,样本却落入接受域 W ‾ \overline{W} W,于是采取了接受 H 0 \mathrm{H}_0 H0的错误决策,此时称这样的错误为第二类错误,计算公式为 β = P { X ∈ W ‾ ∣ H 1 } \beta=P\{X\in\overline{W}|\mathrm{H}_1\} β=P{ XWH1}在样本量给定的条件下, α \alpha α β \beta β中一个减小必导致另一个增大,所以不可能找到一个使 α \alpha α β \beta β都小的检验。另外,犯第二类错误的概率在很多情况下不易求出。由于不能同时控制一个检验的犯第一类,第二类错误的概率,在此背景下,会采取折中的方案,通常的作法是仅限制犯第一类错误的概率,这就是费希尔的显著性检验,显著性水平 α \alpha α就是用来控制犯第一类错误的概率。

2.4 给出拒绝域

在确定显著性水平后,可以给出检验的拒绝域 W W W。在以上实例中,对给定的显著性水平 α \alpha α,则要求对于任意的 θ ≥ 110 \theta \ge 110 θ110,则有 g ( θ ) = P ( x ˉ ≤ c ) = P ( x ˉ − θ 4 / 5 ≤ c − θ 4 / 5 ) = Φ ( c − θ 4 / 5 ) ≤ α g(\theta)=P(\bar{x}\le c)=P\left(\frac{\bar{x}-\theta}{4/5}\le\frac{c-\theta}{4/5}\right)=\Phi\left(\frac{c-\theta}{4/5}\right)\le\alpha g(θ)=P(xˉc)=P(4/5xˉθ4/5cθ)=Φ(4/5cθ)α其中 x ˉ ∼ N ( θ , 16 25 ) \bar{x}\sim N(\theta,\frac{16}{25}) xˉN(θ,2516)于是 g ( θ ) g(\theta) g(θ)是关于 θ \theta θ的单调递减函数,因此只需要求以下等式 g ( 110 ) = Φ ( 5 ( c − 110 ) 4 ) = α g(110)=\Phi\left(\frac{5(c-110)}{4}\right)=\alpha g(110)=Φ(45(c110))=α用标准正态分布分位数可把上式写成 5 ( c − 110 ) 4 = u α \frac{5(c-110)}{4}=u_\alpha 45(c110)=uα,从而 c c c值为 c = 110 + 0.8 u α c=110+0.8 u_\alpha c=110+0.8uα,检验的拒绝域为 W = { x ˉ ≤ 110 + 0.8 u α } W=\{\bar{x}\le 110+0.8 u_\alpha\} W={ xˉ110+0.8uα}若取 α = 0.05 \alpha=0.05 α=0.05,则 u 0.05 = − u 0.95 u_{0.05}=-u_{0.95} u0.05=u0.95,具体 c c c值为 c = 110 + 0.8 u 0.05 = 110 − 0.8 × 1.645 = 108.684 c=110+0.8 u_{0.05}=110-0.8\times 1.645=108.684 c=110+0.8u0.05=1100.8×1.645=108.684所以,检验的拒绝域为 W = { x ˉ ≤ 108.684 } W=\{\bar{x}\le 108.684\} W={ xˉ108.684}若令 u = x ˉ − 110 4 / 5 u=\frac{\bar{x}-110}{4/5} u=4/5xˉ110,则拒绝域另一种表示为 W = { u ≤ u 0.05 } = { u ≤ − 1.645 } W=\{u\le u_{0.05}\}=\{u\le -1.645\} W={ uu0.05}={ u1.645}

2.5 做出判断

在有了明确的拒绝域 W W W后,根据样本观测值可以做出判断:

  • u ≤ − 1.645 u\le -1.645 u1.645时,则拒绝 H 0 \mathrm{H}_0 H0,即接受 H 1 \mathrm{H}_1 H1
  • u > − 1.645 u> -1.645 u>1.645时,则接受 H 0 \mathrm{H}_0 H0
    在以上实例中,由于 u = 108.2 − 110 4 / 5 = − 2.25 < − 1.645 u=\frac{108.2-110}{4/5}=-2.25<-1.645 u=4/5108.2110=2.25<1.645因此拒绝原假设,即认为该日常生产不正常。

·

3 利用p值进行决策

如果原假设是正确的话,得到目前这个样本数据的可能性 p p p有多大,如果这个可能性 p p p小于显著性水平 α \alpha α就应该拒绝原假设,即若 p < α p<\alpha p<α,拒绝 H 0 \mathrm{H}_0 H0

3.1 p值检验实例

在掷骰子的试验中,掷了 12 12 12次骰子只出现了 1 1 1 6 6 6点。这个现象能够说明,在 5 % 5\% 5%的显著性水平下,出现 6 6 6点的概率小于 1 6 \frac{1}{6} 61吗?

给出一对原假设 H 0 \mathrm{H}_0 H0和备择假设 H 1 \mathrm{H}_1 H1如下所示: H 0 :   p = 1 6 v s H 1 :   p < 1 6 \mathrm{H}_0: \text{ }p=\frac{1}{6}\quad\quad\quad \mathrm{vs}\quad\quad\quad\mathrm{H}_1:\text{ }p<\frac{1}{6} H0: p=61vsH1: p<61 X X X表示骰子为 6 6 6点的次数,此时 X X X服从二项分布 B ( 12 , 1 6 ) B(12,\frac{1}{6}) B(12,61),进而可知当出现 6 6 6点的概率小于 1 6 \frac{1}{6} 61时,可推导出 P ( X ≤ 1 ) = P ( X = 0 ) + P ( X = 1 ) = C 12 0 ( 1 6 ) 0 ( 5 6 ) 12 + C 12 1 ( 1 6 ) 1 ( 5 6 ) 11 = 0.3813 > 0.05 \begin{aligned}P(X\le 1)&=P(X=0)+P(X=1)\\&=C_{12}^0\left(\frac{1}{6}\right)^0\left(\frac{5}{6}\right)^{12}+C_{12}^1\left(\frac{1}{6}\right)^1\left(\frac{5}{6}\right)^{11}\\&=0.3813>0.05\end{aligned} P(X1)=P(X=0)+P(X=1)=C120(61)0(65)12+C121(61)1(65)11=0.3813>0.05所以接受原假设, 即出现 6 6 6点的概率为 1 6 \frac{1}{6} 61

猜你喜欢

转载自blog.csdn.net/qq_38406029/article/details/126544719