【统计学笔记】第八章 假设检验

各种统计量检验的决策准则
各种假设检验的假设的建立

第八章 假设检验


参数估计和假设检验是统计推断的两个组成部分。

  • 假设检验:先对总体参数 μ \mu μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
    • 采用逻辑上的反证法
    • 依据统计上的小概率原理

8.1 假设检验的基本问题

8.1.1 假设问题的提出

8.1.2 假设的表达式

原假设 H 0 H_0 H0):

  • 待检验的假设
  • 总是有等号 = = = ≤ ≤ ≥ ≥
  • 因为总是用下标0表示,故又称“0假设”
  • 一般表示为 μ      符 号      某 个 数 值 \mu \;\; 符号 \;\; 某个数值 μ

备择假设 H 1 H_1 H1):

  • 与原假设对立的假设
  • 总是有不等号: ≠ \ne = < < < > > >
  • 一般表示为 μ      符 号      某 个 数 值 \mu \;\;符号\;\;某个数值 μ

8.1.3 两类错误

  • α \alpha α错误(第Ⅰ类错误,弃真错误):原假设 H 0 H_0 H0为真,却被我们拒绝了,犯这种错误的概率为 α \alpha α
  • β \beta β错误(第Ⅱ类错误,取伪错误):原假设 H 0 H_0 H0为假,我们却没有拒绝,犯这种错误的概率为 β \beta β

假设检验中各种可能结果的概率:

item 没有拒绝 H 0 H_0 H0 拒绝 H 0 H_0 H0
电脑 1 - α \alpha α(正确决策) α \alpha α(弃真错误)
手机 β \beta β(取伪错误) 1 − β 1 - \beta 1β(正确决策)

不能同时减小 α \alpha α错误和 β \beta β错误, α \alpha α β \beta β就小, α \alpha α β \beta β就大

8.1.4 假设检验的流程

在这里插入图片描述

  • (1) 提出原假设和备择假设
    H 0 : μ = 3190 ( 克 ) H 1 : μ ≠ 3190 ( 克 ) H_0: \mu = 3190(克) \\ H_1: \mu \ne 3190(克) H0:μ=3190()H1:μ=3190()
  • (2) 确定适当的检验统计量
    • 选择统计量的方法与参数估计相同,需考虑:
      • 是大样本还是小样本;
      • 总体方差已知还是未知;
    • 检验统计量的基本形式为:
      z = x ˉ − μ 0 σ / n z = \frac{\bar x - \mu_0}{\sigma / \sqrt{n}} z=σ/n xˉμ0
  • (3) 规定显著性水平α
    • 是原假设为真时,拒绝原假设的概率;
    • 表示为 α \alpha α,常用的 α \alpha α 值有 0.01 , 0.05 , 0.10 0.01, 0.05, 0.10 0.01,0.05,0.10,由研究者事先确定,被称为抽样分布的拒绝域;
  • (4) 计算检验统计量的值
  • (5) 作出统计决策
    若 ∣ z ∣ < ∣ z α / 2 ∣ , 不 拒 绝 H 0 ; 若 ∣ z ∣ > ∣ z α / 2 ∣ , 拒 绝 H 0 ; \quad\quad若|z| < |z_{\alpha/2}|,不拒绝H_0;\\ \quad 若|z| > |z_{\alpha/2}|,拒绝H_0; z<zα/2H0z>zα/2H0

8.1.5 用 P P P值进行决策

  • P P P值:当原假设为真时,所得到的样本观察结果或更极端结果出现的概率;
  • 如果 P P P值很小,而这种情况又出现了,就有理由拒绝原假设;
  • P P P与显著性水平比较,如果 P < α P<\alpha Pα,则拒绝原假设;

8.1.6 单侧检验

  • 双侧检验(不知道为什么没有这个标题):

    • 原假设命题为 μ = μ 0 \mu = \mu_0 μ=μ0的形式;
    • 有两个拒绝域、两个临界值;
    • 只要有 μ < μ 0 \mu < \mu_0 μ<μ0或者 μ > μ 0 \mu > \mu_0 μ>μ0二者之一成立就可以拒绝原假设;
  • 左单侧检验

    • 原假设命题为 μ ≥ μ 0 \mu \ge \mu_0 μμ0的形式;
    • 关注的是可以容忍的下限,当 μ \mu μ低于什么水平时就拒绝;
    • 希望数值越大越好
      在这里插入图片描述
  • 右单侧检验

    • 原假设命题为 μ ≤ μ 0 \mu \le \mu_0 μμ0的形式;
    • 关注的是可以容忍的上限,当 μ \mu μ高于什么水平时就拒绝;
    • 希望数值越小越好
      在这里插入图片描述

8.2 一个总体参数的检验

8.2.1 检验统计量的确定

t 统 计 量 的 自 由 度 为 n − 1 z = x ˉ − μ 0 σ / n ( 总 体 标 准 差 σ 已 知 ) t = z = x ˉ − μ 0 s / n ( 总 体 标 准 差 σ 未 知 ) t统计量的自由度为n-1 \\ \qquad \\ \qquad z = \frac{\bar x - \mu_0}{\sigma/\sqrt{n}}(总体标准差\sigma已知)\\ \qquad \\ t = z = \frac{\bar x - \mu_0}{s/\sqrt{n}}(总体标准差\sigma未知) tn1z=σ/n xˉμ0σt=z=s/n xˉμ0σ

  • 当样本量大( n > 30 n>30 n>30),无论是否是正态分布都可以用 z z z 统计量。(当然,随着样本量 n n n 的增大 t t t 分布逐渐接近 z z z 分布,也可以使用 t t t统计量,这根据使用者的偏好。)
  • 当样本量小( n < 30 n<30 n<30),总体标准差 σ \sigma σ已知时就可以用 z z z 统计量,未知时就必须用 t t t 统计量。
    1

8.2.2 总体均值的检验

例题1:

在这里插入图片描述
本题是双侧检验

  • (1) 提出原假设和备择假设
    H 0 : μ = 0.081 m m 没 有 显 著 差 别 H 1 : μ ≠ 0.081 m m 有 显 著 差 别 H_0: \mu = 0.081mm \quad 没有显著差别 \\ H_1: \mu \ne 0.081mm \quad\quad 有显著差别 H0:μ=0.081mmH1:μ=0.081mm
  • (2) 确定适当的检验统计量
    • 200个零件 ⇒ \Rightarrow 大于30,是大样本
    • 样本标准差 s = 0.025 s = 0.025 s=0.025 ⇒ \Rightarrow 总体标准差 σ \sigma σ未知
    • 故使用z统计量:
      z = x ˉ − μ 0 s / n z = \frac{\bar x - \mu_0}{s / \sqrt{n}} z=s/n xˉμ0
  • (3) 规定显著性水平α
    规 定 α = 0.05 , 所 以 z α / 2 = 1.96 规定\alpha = 0.05,所以z_{\alpha/2} = 1.96 α=0.05zα/2=1.96
  • (4) 计算检验统计量的值
    x ‾ = 0.076 , μ 0 = 0.081 , s = 0.025 , n = 200 z = x ˉ − μ 0 s / n = 0.076 − 0.081 0.025 / 200 = − 2.83 \overline x = 0.076,\mu_0 = 0.081,s = 0.025,n = 200\\ \quad \\ z = \frac{\bar x - \mu_0}{s / \sqrt{n}} = \frac{0.076 - 0.081}{0.025/\sqrt{200}} = -2.83 x=0.076μ0=0.081s=0.025n=200z=s/n xˉμ0=0.025/200 0.0760.081=2.83
  • (5) 作出统计决策
    ∣ z ∣ = 2.83 > 1.96 = ∣ z α / 2 ∣ 所 以 根 据 决 策 准 则 , 拒 绝 H 0 , 可 以 认 为 有 显 著 差 别 。 |z| = 2.83 > 1.96 = |z_{\alpha/2}| \\ 所以根据决策准则,拒绝H_0,可以认为有显著差别。 z=2.83>1.96=zα/2H0
例题2:

在这里插入图片描述

本题是双侧检验

  • (1) 提出原假设和备择假设
    H 0 : μ = 5 性 能 良 好 H 1 : μ ≠ 5 性 能 不 好 H_0: \mu = 5 \quad 性能良好 \\ H_1 :\mu\ne 5 \quad 性能不好 H0:μ=5H1:μ=5
  • (2) 确定适当的检验统计量
    • 10个肥皂 ⇒ \Rightarrow 小于30,是小样本
    • 样本标准差 s = 0.3 s = 0.3 s=0.3 ⇒ \Rightarrow σ \sigma σ未知
    • 故使用t统计量:
      t = x ˉ − μ 0 s / n t = \frac{\bar x - \mu_0}{s / \sqrt{n}} t=s/n xˉμ0
  • (3) 规定显著性水平α
    规 定 α = 0.05 , 所 以 z α / 2 = 1.96 规定\alpha = 0.05,所以z_{\alpha/2} = 1.96 α=0.05zα/2=1.96
  • (4) 计算检验统计量的值
    x ‾ = 5.3 , μ 0 = 5 , s = 0.3 , n = 10 t = x ˉ − μ 0 s / n = 5.3 − 5 0.3 / 10 = 3.16 \overline x = 5.3,\mu_0 = 5,s = 0.3,n = 10\\ \quad \\ t = \frac{\bar x - \mu_0}{s / \sqrt{n}} = \frac{5.3-5}{0.3/\sqrt{10}} = 3.16 x=5.3μ0=5s=0.3n=10t=s/n xˉμ0=0.3/10 5.35=3.16
  • (5) 作出统计决策
  • t t t 统计量的自由度为 9 : n − 1 = 10 − 1 = 9 9:n - 1 = 10-1 = 9 9n1=101=9
    ∣ t ∣ = 3.16 > 2.2622 = ∣ t α / 2 ( 9 ) ∣ 所 以 根 据 决 策 准 则 , 拒 绝 H 0 , 可 以 认 为 机 器 性 能 不 好 。 |t| = 3.16 > 2.2622 = |t_{\alpha/2}(9)| \\ 所以根据决策准则,拒绝H_0,可以认为机器性能不好。 t=3.16>2.2622=tα/2(9)H0

8.2.3 总体比例的检验

一般的总体比例的调查都会使用大样本量,因为比例这个东西样本量大了才有意义,所以不用就是是大样本还是小样本,就只有大样本

  • z统计量为:
    z = p − π 0 π 0 ( 1 − π 0 ) n p 为 样 本 比 例 , π 0 为 总 体 比 例 π 的 假 设 值 z = \frac{p - \pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}} \\ p为样本比例,\pi_0为总体比例\pi的假设值 z=nπ0(1π0) pπ0pπ0π
    例题:
    在这里插入图片描述
  • (1) 提出原假设和备择假设
    H 0 : π = 14.7 % 支 持 H 1 : π ≠ 14.7 % 不 支 持 H_0: \pi = 14.7\% \quad\quad 支持 \\ H_1: \pi \ne 14.7\% \quad 不支持 H0:π=14.7%H1:π=14.7%
  • (2) 确定适当的检验统计量
    • 400名居民 ⇒ \Rightarrow 大于30,是大样本
    • 故使用z统计量:
      z = p − π 0 π 0 ( 1 − π 0 ) n z = \frac{p - \pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}} z=nπ0(1π0) pπ0
  • (3) 规定显著性水平α
    规 定 α = 0.05 , 所 以 z α / 2 = 1.96 规定\alpha = 0.05,所以z_{\alpha/2} = 1.96 α=0.05zα/2=1.96
  • (4) 计算检验统计量的值
    p = 57 400 = 0.1424 , π 0 = 0.147 , n = 400 z = p − π 0 π 0 ( 1 − π 0 ) n = − 0.254 p = \frac{57}{400} = 0.1424,\pi_0 = 0.147,n = 400\\ z = \frac{p - \pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}} = -0.254 p=40057=0.1424π0=0.147n=400z=nπ0(1π0) pπ0=0.254
  • (5) 作出统计决策
    ∣ z ∣ = 0.254 < 1.96 = ∣ z α / 2 ∣ 所 以 根 据 决 策 准 则 , 不 能 拒 绝 H 0 , 支 持 。 |z| = 0.254 < 1.96 = |z_{\alpha/2}| \\ 所以根据决策准则,不能拒绝H_0,支持。 z=0.254<1.96=zα/2H0

8.2.4 总体方差的检验

  • χ 2 \chi^2 χ2统计量为(通常采用单侧检验):
    χ 2 = ( n − 1 ) s 2 σ 2 ∼ χ 2 ( n − 1 ) \chi^2 = \frac{(n-1)s^2}{\sigma^2} \sim \chi^2(n-1) χ2=σ2(n1)s2χ2(n1)

例题:

在这里插入图片描述

  • (1) 提出原假设和备择假设
    H 0 : σ 2 ≤ 1 达 到 要 求 H 1 : σ 2 > 1 未 达 到 要 求 H_0: \sigma^2 \le 1 \quad\quad 达到要求 \\ H_1: \sigma^2 > 1 \quad 未达到要求 H0:σ21H1:σ2>1
  • (2) 确定适当的检验统计量
    • 因为是检验方差,所以使用 χ 2 \chi^2 χ2统计量
      χ 2 = ( n − 1 ) s 2 σ 2 \chi^2 = \frac{(n-1)s^2}{\sigma^2} χ2=σ2(n1)s2
  • (3) 规定显著性水平α
    规 定 α = 0.05 规定\alpha = 0.05 α=0.05
  • (4) 计算检验统计量的值
    s = 0.866 , σ = 1 , 自 由 度 n − 1 = 24 , n = 25 χ 2 = ( n − 1 ) s 2 σ 2 = ( 25 − 1 ) 0.866 1 = 20.8 s = 0.866,\sigma = 1,自由度n-1 = 24 ,n = 25\\ \chi^2 = \frac{(n-1)s^2}{\sigma^2} = \frac{(25-1)0.866}{1} = 20.8 s=0.866σ=1n1=24n=25χ2=σ2(n1)s2=1(251)0.866=20.8
  • (5) 作出统计决策
    χ 2 = 20.8 < 36.415 = ∣ χ 0.05 2 ( 24 ) 所 以 根 据 决 策 准 则 , 不 能 拒 绝 H 0 , 达 到 要 求 。 \chi^2 = 20.8 < 36.415 = |\chi^2_{0.05}(24) \\ 所以根据决策准则,不能拒绝H_0,达到要求。 χ2=20.8<36.415=χ0.052(24)H0

8.3 两个总体参数的检验

8.3.1 检验统计量的确定

在这里插入图片描述

8.3.2 两个总体均值之差的检验

  1. 总体标准差已知:
    在这里插入图片描述
  2. 总体标准差未知:
    在这里插入图片描述
    在这里插入图片描述

8.3.3 两个总体比例之差的检验

  • 两个总体是独立的
  • 两个总体都服从二项分布
  • 可以用正态分布来近似
  1. 检验两个总体比例相等的假设:
    p = x 1 + x 2 n 1 + n 2 = p 1 n 1 + p 2 n 2 n 1 + n 2 z = p 1 − p 2 p ( 1 − p ) n 1 + p ( 1 − p ) n 2 p = \frac{x_1+x_2}{n_1+n_2} = \frac{p_1n_1+p_2n_2}{n_1+n_2} \\ \qquad\\ z = \frac{p_1 - p_2}{\sqrt{ \frac{p(1-p)}{n_1} + \frac{p(1-p)}{n_2} }} p=n1+n2x1+x2=n1+n2p1n1+p2n2z=n1p(1p)+n2p(1p) p1p2
  2. 检验两个总体比例之差不为零的假设:
    在这里插入图片描述

8.3.4 两个总体方差比的检验

F F F统计量:
F = s 1 2 s 2 2 ∼ F ( n 1 − 1 , n 2 − 2 ) F = \frac{s_1^2}{s_2^2} \sim F(n_1-1, n_2-2) F=s22s12F(n11,n22)

  • 检验两个方差比是否相等(在双侧检验中):
    将较大的 s 2 s^2 s2放到分子 s 1 2 s_1^2 s12
    如 果 F 1 − α / 2 ≤ s 1 2 s 2 2 ≤ F α / 2 就 接 受 原 假 设 , 否 则 就 落 入 拒 绝 域 从 而 拒 绝 原 假 设 ; 如果 \quad F_{1-\alpha/2} \le \frac{s_1^2}{s_2^2} \le F_{\alpha/2} \quad就接受原假设,否则就落入拒绝域从而拒绝原假设; F1α/2s22s12Fα/2
  • 检验两个方差比的大小(在单侧检验中):
    如 果 s 1 2 s 2 2 ≤ F α 就 接 受 原 假 设 , 否 则 就 落 入 拒 绝 域 从 而 拒 绝 原 假 设 如果\quad \frac{s_1^2}{s_2^2} \le F_{\alpha} \quad就接受原假设,否则就落入拒绝域从而拒绝原假设 s22s12Fα
    在这里插入图片描述

在这里插入图片描述

8.3.5 检验中的匹配样本

我觉得不会考所以就不写了


8.4 检验问题的进一步说明

8.4.1 关于检验结果的解释

8.4.2 单侧检验中假设的建立

详见:各种假设检验的假设的建立

猜你喜欢

转载自blog.csdn.net/MYMarcoreus/article/details/111569310