【数理统计学习】统计假设检验

统计假设检验可分为参数假设检验和非参数假设检验两大部分。

当总体分布形式已知，检验的目的是对总体的参数及其性质作出判断，则称这种检验为参数假设检验。

若总体分布形式未知，需对总体分布函数形式或总体之间的关系进行推断，则称为非参数假设检验。

显著性检验：先提出假设，然后作出否定或者不否定的判断，称为显著性检验。

一、检验法则

有两个对立的假设，其中$H_0$称为原假设（零假设）;$H_1$称为备择假设（对立假设）。

要检验总体均值$\mu$，实际上可转化为检验样本均值$\overline{X}$，因为$\overline{X}$的观察值$\overline{x}$的大小在一定程度上反映了的$\mu$大小。如果$H_0$成立，则$\mid \overline{x}-\mu_0 \mid$一般不应太大，如果$\mid \overline{x}-\mu_0 \mid$过分大，则可怀疑$H_0$的正确性从而拒绝$H_0$，反之则接受$H_0$。

又考虑到当$H_0$成立时，统计量 $\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} $ ~ $ N(0,1)$，这样衡量 $\mid \overline{x} - \mu_0 \mid$ 的大小就可等价地归结为衡量 $\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} $ 的大小，由此我们可选定一正数$k$，使得当$\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} \geq k$时，就拒绝$H_0$，当$\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} < k$时，就接受$H_0$。

由于$\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} $ ~ $ N(0,1)$，根据标准正态分布分位点定义可得：
\[P \lbrace \frac{\mid \overline{x} - \mu_0 \mid}{\sigma / \sqrt{n}} \geq k \mid H_0为真 \rbrace = P \lbrace \frac{\mid \overline{x} - \mu_0 \mid}{\sigma / \sqrt{n}} \geq u_{1-\frac{\alpha}{2}} \mid H_0为真 \rbrace = \alpha\]

这样，我们就得到如下检验法则：

若$\frac{\mid \overline{x} - \mu_0 \mid}{\sigma / \sqrt{n}} \geq u_{1-\frac{\alpha}{2}}$，则拒绝$H_0$；

若$\frac{\mid \overline{x} - \mu_0 \mid}{\sigma / \sqrt{n}} < u_{1-\frac{\alpha}{2}}$，则接受$H_0$。

于是，$\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} $就成了检验统计量。

当然，这只是讨论了正态总体参数的假设检验问题，对于其他假设检验，虽然检验统计量不同，但其检验法则、基本思路一样。

二、两类错误

（一）第I类错误

当$H_0$为真时，我们却作出了拒绝$H_0$的判断，这个时候我们就犯了第I类错误，又称为“弃真”。即在原假设成立的情况下拒绝了原假设，从而把正确的内容当作错误的内容抛弃了。

犯第I类错误的概率为：$P \lbrace 拒绝H_0 \mid H_0为真 \rbrace = \alpha$

这里，$\alpha$为显著性水平。

（二）第II类错误

当$H_0$不成立时，却接受$H_0$了，我们称这类错误为第II类错误，又称为“取伪”。

犯第II类错误的概率为：$P \lbrace 接受H_0 \mid H_0为假 \rbrace = \beta$

现实中$\alpha$、$beta$的值不可能同时小，也就是说，在样本容量给定的情况下，如果减少犯第I类错误的概率，就可能增加犯第II类错误的概率。由于第I类错误相对于第II类错误导致的后果更为严重，因此现实中的做法通常是对犯第I类错误的概率加以控制，然后再适当考虑犯第II类错误的概率。

我们把这种只对犯第I类错误的概率加以控制，而不考虑犯第II类错误的检验问题，称为显著性检验问题。

三、基本方法

参数假设检验通常采用$\mu$检验法、$t$检验法、$F$检验法、$\chi^2$检验法等；

非参数假设检验通常采用皮尔逊拟合检验、魏氏检验、麦氏检验法。

（一）参数假设检验法

参数假设检验法具体包括正态总体参数检验和非正态总体参数检验。

1、正态总体参数检验

对于正态总体，其参数无非是两个：$\mu$和$\sigma^2$。如果加上两个正态总体的参数一块比较，也只有四种情形：①关于$\mu$的检验；②关于$\sigma^2$的检验；③关于$\mu_1-\mu_2$的检验；④关于$\frac{\sigma_1^2}{\sigma_2^2}$的检验。

（1）$\mu$检验

$\mu$检验适用于在方差已知的情况下，对期望值$\mu$的检验（包括单总体和多总体）。

a.在单个正态总体情况下，适用检验统计量：

$\mu = \frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}}$~$N(0,1)$

b.在两个正态总体情况下，设$x_1,x_2,\ldots,x_{n_1}$,为出自$N(\mu_1,\sigma_1^2)$的样本，$y_1,y_2,\ldots,y_{n_2}$为出自$N(\mu_2,\sigma_2^2)$的样本，$\sigma_1^2,\sigma_2^2$已知，且样本之间相互独立。则适用统计量为：

$\mu = \frac{\overline{x} - \overline{y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}$ ~ $N(0,1)$

另外，对总体百分数的检验一般也采用检验法进行，其适用统计量为：

\[\mu = \frac{p_x-p_{\mu}}{\sqrt{\frac{p_{\mu}(1-p_{\mu})}{n}}}\]

其中，$p_x$为样本百分数，$p_{\mu}$为总体百分数。

（2）$t$检验

$t$检验适用于当方差未知时对期望值$\mu$的检验。总体可以是单总体，也可以是双总体。但如果是双总体，它们之间的样本必须是独立的。

a.对于单总体，适用检验统计量为：
$t= \frac{\overline{x} - \mu_0}{\frac{s}{\sqrt{n}}}$~$t(n-1)$
b.对于双总体，可分为两种情况进行讨论。

第一种情况是，$\sigma_1^2,\sigma_2^2$未知，但$\sigma_1^2=\sigma_2^2=\sigma^2$。此时可选择检验统计量：
$t= \frac{\overline{x} -\overline{y}}{s_{\omega} \cdot \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}$~$t(n_1+n_2-2)$

第二种情况是，$\sigma_1^2,\sigma_2^2$未知，但$n_1=n_2=n$。此时可考虑采用配对检验法，具体方法如下：

令：$d_i=x_i-y_i(i=1,2,\ldots,n)$，并假定$d_1,d_2,\ldots,d_n$分别是来自正态总体$N(\mu_d,\sigma^2)$的样本。$\mu_d,\sigma^2$均未知，$\overline{d}$与$s^2$分别是$d_1,d_2,\ldots,d_n$的样本均值和样本方差。若进行双边检验，可令$H_0:\mu_d=0,H_1:\mu_d \neq 0$。

此时可选择$t= \frac{\overline{d}-0}{\frac{s}{\sqrt{n}}}$~$t_{1-\frac{\alpha}{2}}(n-1)$作为检验统计量，其拒绝域为：
\[c_1= \lbrace t \mid \mid t \mid \geq t_{1-\alpha}(n-1) \rbrace\]

（3）$\chi^2$检验

$\chi^2$检验主要用于对方差$\sigma^2$的检验，且适用于单参数情形。

a.$\mu$未知

设$x_1,x_2,\ldots,x_n$为$N(\mu,\sigma^2)$的一个样本，考虑假设：
①$H_0:\sigma^2 = \sigma_0^2, H_1:\sigma^2 \neq \sigma_0^2$
②$H_0:\sigma^2 \leq \sigma_0^2, H_1:\sigma^2 > sigma_0^2$
适用检验统计量为：
$\chi^2 = \frac{(n-1)s^2}{\sigma_0^2}$~$\chi^2(n-1)$

b.$\mu$已知

适用于检验统计量为：

$\chi^2 = \frac{\sum_{i=1}^n (x_i-\mu_0)^2}{\sigma_0^2}$~$\chi^2(n)$

(4)$F$检验

$F$检验也是用于对方差的检验，不同的是，$F$检验往往用于两参数情形。

设$x_1,x_2,\ldots,x_{n_1}$和$y_1,y_2,\ldots,y_{n_2}$分别为出自$N(\mu_1,\sigma_1^2)$和$N(\mu_2,\sigma_2^2)$的样本，且样本之间独立。考虑假设：
①$H_0:\sigma_1^2=\sigma_2^2, H_1:\sigma_1^2 \neq \sigma_2^2$
②$H_0:\sigma_1^2 \leq \sigma_2^2, H_1: \sigma_1^2 > \sigma_2^2$

适用检验统计量为：
$F=\frac{s_1^2}{s_2^2}$~$F(n_1-1,n_2-1)$

2、非正态总体参数检验

非正态总体的抽样分布不易求出，求检验统计量及其分布就很困难了，因此除一些特殊例子外，非正态总体参数的假设检验常采用大样本方法。大样本一般要求$n \geq 30$，最好$n \geq 50$。

设$x_1,x_2,\ldots,x_n$是总体$X$的样本，$X$~$N(\mu,\sigma^2 )$，$n$足够大。要检验的假设有：

（1）$H_0:\mu=\mu_0, H_1:\mu \neq \mu_0$

（2）$H_0:\mu \geq \mu_0, H_1:\mu < \mu_0$

（3）$H_0:\mu \leq \mu_0, H_1:\mu > \mu_0$

由于$X$不是正态分布，故求出其检验统计量及其分布比较困难，但当$n$足够大且$H_0$成立时，根据中心极限定理，有：
$\mu = \frac{\overline{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}}$~$N(0,1)$

在具体选择检验统计量时，可分两种情况讨论：

（1）当$\sigma^2$已知时，可选择检验统计量：

$\mu = \frac{\overline{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}}$~$N(0,1)$

（2）当$\sigma^2$未知时，可选择检验统计量：

$\mu = \frac{\overline{x} - \mu_0}{\frac{s}{\sqrt{n}}}$~$N(0,1)$

（二）非参数检验法

1、皮尔逊$\chi^2$拟合检验法

2、魏氏（Wilcoxon）检验

3、麦氏（McNehmar）检验

参考文献：
[1] 《统计学》第二版. 2010. 游士兵