《统计学：从数据到结论》学习笔记(part4)--为啥不能说接受原假设

学习笔记

学习书籍：《统计学：从数据到结论》-吴喜之；

参考书目：《统计学》-贾俊平；

几个基本概念

原假设：提出一个(或两个)参数是否等于(或大于等于、小于等于)某个特殊值的命题。

备择假设：与原假设逻辑相反的假设。

第一类错误(弃真错误)：原假设 $H_0$ 为真却被我们拒绝了，犯这种错误的概率用 $\alpha$ 表示，所以也称 $\alpha$ 错误.

第二类错误(取伪错误)：原假设 $H_0$ 为伪我们却没有拒绝，犯这种错误的概率用 $\beta$ 表示.所以也称 $\beta$ 错误.

P值：当原假设为真时，得到的样本数据或更极端数据的概率(贾俊平);在零假设下,检验统计量取其实现值及(沿着备选假设的方向)更加极端值的概率(吴喜之)。

几个问题

原假设和备择假设哪一个是正确的？

原假设和备择假设哪一个正确，是确定性的，没有概率可言的，而可能犯错误的是人。涉及假设检验犯错误的概率，就是犯第一类错误的概率和犯第二类错误的概率，负责任的态度是无论做出什么决策，都应该给出该决策可能犯错误的概率。

到底 $p$ 值要多小的时候才能拒绝原假设？

在一般的统计学教材中，使用最多的标准是，拒绝原假设的概率应该小于0.05，当然也可以是0.1或者0.01等等。这种事先规定的概率称为显著性水平，用字母 $\alpha$ 表示。 $\alpha$ 并不是越小越好，因为这很可能导致不容易拒绝原假设，使得犯第二类错误的概率增大。当 $p$ 值小于或等于 $\alpha$ 时，就拒绝零假设。所以 $\alpha$ 是所允许的犯第一类错误概率的最大值。无论统计学家用多大的 $\alpha$ 作为显著性水平，都不能脱离实际问题，统计显著不一定等于实际显著，反过来也一样。

实际上，很多统计软件只给出 $p$ 值，而不给出显著性水平，有很多方便之处。我们可以根据我们实际得到的 $p$ 值来减少显著性水平 $\alpha$ 以展现结果的精确性，这是没有害处的。比如，我身高161cm,我一般说我高于160cm，但我不愿意说我高于150cm，虽然这两种说法都没有错误，但是第一种说法，听起来更好听一些。

为啥不能说接受原假设？

有些统计学教材中，会出现不能拒绝原假设，就“接受原假设”的情况，这种说法是不严格的。首先，如果我们说“接受原假设”，那么就要负责任地提出接受零假设时可能犯第二类错误的概率，但是，这只有在备择假设仅仅是一个与零假设不同的确定值(不是范围)时才有可能，而多数统计学教材中的备择假设是一个范围，这根本无法确定犯第二类错误的概率。在许多诸如应用回归分析等领域的教材书中，往往也把一系列不能拒绝零假设的检验，当成接受接受这些检验的通行证，比如，不能拒绝某样本的正态性，就默认为某样本是正态分布的。其次，不能拒绝这些零假设，仅仅说明根据所使用的检验方法(或检验统计量)和当前的数据，没有足够的证据拒绝这些原假设而已。因此，在不能拒绝零假设时，只能说，按照目前的证据和检验方法，不足以拒接零假设而已，而零假设仍然是一个数学假定。统计工作者必须给用户一个没有偏见的信息，而不是代替用户做没有指明风险的决策。

山羊菌

发布了219 篇原创文章 · 获赞 102 · 访问量 9万+

私信关注