第八章 假设检验
参数估计和假设检验是统计推断的两个组成部分。
- 假设检验:先对总体参数 μ \mu μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
- 采用逻辑上的反证法
- 依据统计上的小概率原理
8.1 假设检验的基本问题
8.1.1 假设问题的提出
8.1.2 假设的表达式
原假设( H 0 H_0 H0):
- 待检验的假设
- 总是有等号 = = =, ≤ ≤ ≤ 或 ≥ ≥ ≥
- 因为总是用下标0表示,故又称“0假设”
- 一般表示为 μ 符 号 某 个 数 值 \mu \;\; 符号 \;\; 某个数值 μ符号某个数值
备择假设( H 1 H_1 H1):
- 与原假设对立的假设
- 总是有不等号: ≠ \ne =, < < < 或 > > >
- 一般表示为 μ 符 号 某 个 数 值 \mu \;\;符号\;\;某个数值 μ符号某个数值
8.1.3 两类错误
- α \alpha α错误(第Ⅰ类错误,弃真错误):原假设 H 0 H_0 H0为真,却被我们拒绝了,犯这种错误的概率为 α \alpha α;
- β \beta β错误(第Ⅱ类错误,取伪错误):原假设 H 0 H_0 H0为假,我们却没有拒绝,犯这种错误的概率为 β \beta β;
假设检验中各种可能结果的概率:
item | 没有拒绝 H 0 H_0 H0 | 拒绝 H 0 H_0 H0 |
---|---|---|
电脑 | 1 - α \alpha α(正确决策) | α \alpha α(弃真错误) |
手机 | β \beta β(取伪错误) | 1 − β 1 - \beta 1−β(正确决策) |
不能同时减小 α \alpha α错误和 β \beta β错误, α \alpha α大 β \beta β就小, α \alpha α小 β \beta β就大
8.1.4 假设检验的流程
- (1) 提出原假设和备择假设
H 0 : μ = 3190 ( 克 ) H 1 : μ ≠ 3190 ( 克 ) H_0: \mu = 3190(克) \\ H_1: \mu \ne 3190(克) H0:μ=3190(克)H1:μ=3190(克) - (2) 确定适当的检验统计量
- 选择统计量的方法与参数估计相同,需考虑:
- 是大样本还是小样本;
- 总体方差已知还是未知;
- 检验统计量的基本形式为:
z = x ˉ − μ 0 σ / n z = \frac{\bar x - \mu_0}{\sigma / \sqrt{n}} z=σ/nxˉ−μ0
- 选择统计量的方法与参数估计相同,需考虑:
- (3) 规定显著性水平α
- 是原假设为真时,拒绝原假设的概率;
- 表示为 α \alpha α,常用的 α \alpha α 值有 0.01 , 0.05 , 0.10 0.01, 0.05, 0.10 0.01,0.05,0.10,由研究者事先确定,被称为抽样分布的拒绝域;
- (4) 计算检验统计量的值
- (5) 作出统计决策
若 ∣ z ∣ < ∣ z α / 2 ∣ , 不 拒 绝 H 0 ; 若 ∣ z ∣ > ∣ z α / 2 ∣ , 拒 绝 H 0 ; \quad\quad若|z| < |z_{\alpha/2}|,不拒绝H_0;\\ \quad 若|z| > |z_{\alpha/2}|,拒绝H_0; 若∣z∣<∣zα/2∣,不拒绝H0;若∣z∣>∣zα/2∣,拒绝H0;
8.1.5 用 P P P值进行决策
- P P P值:当原假设为真时,所得到的样本观察结果或更极端结果出现的概率;
- 如果 P P P值很小,而这种情况又出现了,就有理由拒绝原假设;
- 将 P P P与显著性水平比较,如果 P < α P<\alpha P<α,则拒绝原假设;
8.1.6 单侧检验
-
双侧检验(不知道为什么没有这个标题):
- 原假设命题为 μ = μ 0 \mu = \mu_0 μ=μ0的形式;
- 有两个拒绝域、两个临界值;
- 只要有 μ < μ 0 \mu < \mu_0 μ<μ0或者 μ > μ 0 \mu > \mu_0 μ>μ0二者之一成立就可以拒绝原假设;
-
左单侧检验
- 原假设命题为 μ ≥ μ 0 \mu \ge \mu_0 μ≥μ0的形式;
- 关注的是可以容忍的下限,当 μ \mu μ低于什么水平时就拒绝;
- 希望数值越大越好
-
右单侧检验
- 原假设命题为 μ ≤ μ 0 \mu \le \mu_0 μ≤μ0的形式;
- 关注的是可以容忍的上限,当 μ \mu μ高于什么水平时就拒绝;
- 希望数值越小越好
8.2 一个总体参数的检验
8.2.1 检验统计量的确定
t 统 计 量 的 自 由 度 为 n − 1 z = x ˉ − μ 0 σ / n ( 总 体 标 准 差 σ 已 知 ) t = z = x ˉ − μ 0 s / n ( 总 体 标 准 差 σ 未 知 ) t统计量的自由度为n-1 \\ \qquad \\ \qquad z = \frac{\bar x - \mu_0}{\sigma/\sqrt{n}}(总体标准差\sigma已知)\\ \qquad \\ t = z = \frac{\bar x - \mu_0}{s/\sqrt{n}}(总体标准差\sigma未知) t统计量的自由度为n−1z=σ/nxˉ−μ0(总体标准差σ已知)t=z=s/nxˉ−μ0(总体标准差σ未知)
- 当样本量大( n > 30 n>30 n>30),无论是否是正态分布都可以用 z z z 统计量。(当然,随着样本量 n n n 的增大 t t t 分布逐渐接近 z z z 分布,也可以使用 t t t统计量,这根据使用者的偏好。)
- 当样本量小( n < 30 n<30 n<30),总体标准差 σ \sigma σ已知时就可以用 z z z 统计量,未知时就必须用 t t t 统计量。
8.2.2 总体均值的检验
例题1:
本题是双侧检验
- (1) 提出原假设和备择假设
H 0 : μ = 0.081 m m 没 有 显 著 差 别 H 1 : μ ≠ 0.081 m m 有 显 著 差 别 H_0: \mu = 0.081mm \quad 没有显著差别 \\ H_1: \mu \ne 0.081mm \quad\quad 有显著差别 H0:μ=0.081mm没有显著差别H1:μ=0.081mm有显著差别 - (2) 确定适当的检验统计量
- 200个零件 ⇒ \Rightarrow ⇒ 大于30,是大样本
- 样本标准差 s = 0.025 s = 0.025 s=0.025 ⇒ \Rightarrow ⇒ 总体标准差 σ \sigma σ未知
- 故使用z统计量:
z = x ˉ − μ 0 s / n z = \frac{\bar x - \mu_0}{s / \sqrt{n}} z=s/nxˉ−μ0
- (3) 规定显著性水平α
规 定 α = 0.05 , 所 以 z α / 2 = 1.96 规定\alpha = 0.05,所以z_{\alpha/2} = 1.96 规定α=0.05,所以zα/2=1.96 - (4) 计算检验统计量的值
x ‾ = 0.076 , μ 0 = 0.081 , s = 0.025 , n = 200 z = x ˉ − μ 0 s / n = 0.076 − 0.081 0.025 / 200 = − 2.83 \overline x = 0.076,\mu_0 = 0.081,s = 0.025,n = 200\\ \quad \\ z = \frac{\bar x - \mu_0}{s / \sqrt{n}} = \frac{0.076 - 0.081}{0.025/\sqrt{200}} = -2.83 x=0.076,μ0=0.081,s=0.025,n=200z=s/nxˉ−μ0=0.025/2000.076−0.081=−2.83 - (5) 作出统计决策
∣ z ∣ = 2.83 > 1.96 = ∣ z α / 2 ∣ 所 以 根 据 决 策 准 则 , 拒 绝 H 0 , 可 以 认 为 有 显 著 差 别 。 |z| = 2.83 > 1.96 = |z_{\alpha/2}| \\ 所以根据决策准则,拒绝H_0,可以认为有显著差别。 ∣z∣=2.83>1.96=∣zα/2∣所以根据决策准则,拒绝H0,可以认为有显著差别。
例题2:
本题是双侧检验
- (1) 提出原假设和备择假设
H 0 : μ = 5 性 能 良 好 H 1 : μ ≠ 5 性 能 不 好 H_0: \mu = 5 \quad 性能良好 \\ H_1 :\mu\ne 5 \quad 性能不好 H0:μ=5性能良好H1:μ=5性能不好 - (2) 确定适当的检验统计量
- 10个肥皂 ⇒ \Rightarrow ⇒ 小于30,是小样本
- 样本标准差 s = 0.3 s = 0.3 s=0.3 ⇒ \Rightarrow ⇒ σ \sigma σ未知
- 故使用t统计量:
t = x ˉ − μ 0 s / n t = \frac{\bar x - \mu_0}{s / \sqrt{n}} t=s/nxˉ−μ0
- (3) 规定显著性水平α
规 定 α = 0.05 , 所 以 z α / 2 = 1.96 规定\alpha = 0.05,所以z_{\alpha/2} = 1.96 规定α=0.05,所以zα/2=1.96 - (4) 计算检验统计量的值
x ‾ = 5.3 , μ 0 = 5 , s = 0.3 , n = 10 t = x ˉ − μ 0 s / n = 5.3 − 5 0.3 / 10 = 3.16 \overline x = 5.3,\mu_0 = 5,s = 0.3,n = 10\\ \quad \\ t = \frac{\bar x - \mu_0}{s / \sqrt{n}} = \frac{5.3-5}{0.3/\sqrt{10}} = 3.16 x=5.3,μ0=5,s=0.3,n=10t=s/nxˉ−μ0=0.3/105.3−5=3.16 - (5) 作出统计决策
- t t t 统计量的自由度为 9 : n − 1 = 10 − 1 = 9 9:n - 1 = 10-1 = 9 9:n−1=10−1=9
∣ t ∣ = 3.16 > 2.2622 = ∣ t α / 2 ( 9 ) ∣ 所 以 根 据 决 策 准 则 , 拒 绝 H 0 , 可 以 认 为 机 器 性 能 不 好 。 |t| = 3.16 > 2.2622 = |t_{\alpha/2}(9)| \\ 所以根据决策准则,拒绝H_0,可以认为机器性能不好。 ∣t∣=3.16>2.2622=∣tα/2(9)∣所以根据决策准则,拒绝H0,可以认为机器性能不好。
8.2.3 总体比例的检验
一般的总体比例的调查都会使用大样本量,因为比例这个东西样本量大了才有意义,所以不用就是是大样本还是小样本,就只有大样本
- z统计量为:
z = p − π 0 π 0 ( 1 − π 0 ) n p 为 样 本 比 例 , π 0 为 总 体 比 例 π 的 假 设 值 z = \frac{p - \pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}} \\ p为样本比例,\pi_0为总体比例\pi的假设值 z=nπ0(1−π0)p−π0p为样本比例,π0为总体比例π的假设值
例题:
- (1) 提出原假设和备择假设
H 0 : π = 14.7 % 支 持 H 1 : π ≠ 14.7 % 不 支 持 H_0: \pi = 14.7\% \quad\quad 支持 \\ H_1: \pi \ne 14.7\% \quad 不支持 H0:π=14.7%支持H1:π=14.7%不支持 - (2) 确定适当的检验统计量
- 400名居民 ⇒ \Rightarrow ⇒ 大于30,是大样本
- 故使用z统计量:
z = p − π 0 π 0 ( 1 − π 0 ) n z = \frac{p - \pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}} z=nπ0(1−π0)p−π0
- (3) 规定显著性水平α
规 定 α = 0.05 , 所 以 z α / 2 = 1.96 规定\alpha = 0.05,所以z_{\alpha/2} = 1.96 规定α=0.05,所以zα/2=1.96 - (4) 计算检验统计量的值
p = 57 400 = 0.1424 , π 0 = 0.147 , n = 400 z = p − π 0 π 0 ( 1 − π 0 ) n = − 0.254 p = \frac{57}{400} = 0.1424,\pi_0 = 0.147,n = 400\\ z = \frac{p - \pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}} = -0.254 p=40057=0.1424,π0=0.147,n=400z=nπ0(1−π0)p−π0=−0.254 - (5) 作出统计决策
∣ z ∣ = 0.254 < 1.96 = ∣ z α / 2 ∣ 所 以 根 据 决 策 准 则 , 不 能 拒 绝 H 0 , 支 持 。 |z| = 0.254 < 1.96 = |z_{\alpha/2}| \\ 所以根据决策准则,不能拒绝H_0,支持。 ∣z∣=0.254<1.96=∣zα/2∣所以根据决策准则,不能拒绝H0,支持。
8.2.4 总体方差的检验
- χ 2 \chi^2 χ2统计量为(通常采用单侧检验):
χ 2 = ( n − 1 ) s 2 σ 2 ∼ χ 2 ( n − 1 ) \chi^2 = \frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1) χ2=σ2(n−1)s2∼χ2(n−1)
例题:
- (1) 提出原假设和备择假设
H 0 : σ 2 ≤ 1 达 到 要 求 H 1 : σ 2 > 1 未 达 到 要 求 H_0: \sigma^2 \le 1 \quad\quad 达到要求 \\ H_1: \sigma^2 > 1 \quad 未达到要求 H0:σ2≤1达到要求H1:σ2>1未达到要求 - (2) 确定适当的检验统计量
- 因为是检验方差,所以使用 χ 2 \chi^2 χ2统计量
χ 2 = ( n − 1 ) s 2 σ 2 \chi^2 = \frac{(n-1)s^2}{\sigma^2} χ2=σ2(n−1)s2
- 因为是检验方差,所以使用 χ 2 \chi^2 χ2统计量
- (3) 规定显著性水平α
规 定 α = 0.05 规定\alpha = 0.05 规定α=0.05 - (4) 计算检验统计量的值
s = 0.866 , σ = 1 , 自 由 度 n − 1 = 24 , n = 25 χ 2 = ( n − 1 ) s 2 σ 2 = ( 25 − 1 ) 0.866 1 = 20.8 s = 0.866,\sigma = 1,自由度n-1 = 24 ,n = 25\\ \chi^2 = \frac{(n-1)s^2}{\sigma^2} = \frac{(25-1)0.866}{1} = 20.8 s=0.866,σ=1,自由度n−1=24,n=25χ2=σ2(n−1)s2=1(25−1)0.866=20.8 - (5) 作出统计决策
χ 2 = 20.8 < 36.415 = ∣ χ 0.05 2 ( 24 ) 所 以 根 据 决 策 准 则 , 不 能 拒 绝 H 0 , 达 到 要 求 。 \chi^2 = 20.8 < 36.415 = |\chi^2_{0.05}(24) \\ 所以根据决策准则,不能拒绝H_0,达到要求。 χ2=20.8<36.415=∣χ0.052(24)所以根据决策准则,不能拒绝H0,达到要求。
8.3 两个总体参数的检验
8.3.1 检验统计量的确定
8.3.2 两个总体均值之差的检验
- 总体标准差已知:
- 总体标准差未知:
8.3.3 两个总体比例之差的检验
- 两个总体是独立的
- 两个总体都服从二项分布
- 可以用正态分布来近似
- 检验两个总体比例相等的假设:
p = x 1 + x 2 n 1 + n 2 = p 1 n 1 + p 2 n 2 n 1 + n 2 z = p 1 − p 2 p ( 1 − p ) n 1 + p ( 1 − p ) n 2 p = \frac{x_1+x_2}{n_1+n_2} = \frac{p_1n_1+p_2n_2}{n_1+n_2} \\ \qquad\\ z = \frac{p_1 - p_2}{\sqrt{ \frac{p(1-p)}{n_1} + \frac{p(1-p)}{n_2} }} p=n1+n2x1+x2=n1+n2p1n1+p2n2z=n1p(1−p)+n2p(1−p)p1−p2 - 检验两个总体比例之差不为零的假设:
8.3.4 两个总体方差比的检验
F F F统计量:
F = s 1 2 s 2 2 ∼ F ( n 1 − 1 , n 2 − 2 ) F = \frac{s_1^2}{s_2^2} \sim F(n_1-1, n_2-2) F=s22s12∼F(n1−1,n2−2)
- 检验两个方差比是否相等(在双侧检验中):
将较大的 s 2 s^2 s2放到分子 s 1 2 s_1^2 s12上
如 果 F 1 − α / 2 ≤ s 1 2 s 2 2 ≤ F α / 2 就 接 受 原 假 设 , 否 则 就 落 入 拒 绝 域 从 而 拒 绝 原 假 设 ; 如果 \quad F_{1-\alpha/2} \le \frac{s_1^2}{s_2^2} \le F_{\alpha/2} \quad就接受原假设,否则就落入拒绝域从而拒绝原假设; 如果F1−α/2≤s22s12≤Fα/2就接受原假设,否则就落入拒绝域从而拒绝原假设; - 检验两个方差比的大小(在单侧检验中):
如 果 s 1 2 s 2 2 ≤ F α 就 接 受 原 假 设 , 否 则 就 落 入 拒 绝 域 从 而 拒 绝 原 假 设 如果\quad \frac{s_1^2}{s_2^2} \le F_{\alpha} \quad就接受原假设,否则就落入拒绝域从而拒绝原假设 如果s22s12≤Fα就接受原假设,否则就落入拒绝域从而拒绝原假设
8.3.5 检验中的匹配样本
我觉得不会考所以就不写了
8.4 检验问题的进一步说明
8.4.1 关于检验结果的解释
8.4.2 单侧检验中假设的建立
详见:各种假设检验的假设的建立