《统计学:从数据到结论》学习笔记(part4)--为啥不能说接受原假设

学习笔记

学习书籍:《统计学:从数据到结论》-吴喜之;

参考书目:《统计学》-贾俊平;


几个基本概念


原假设:提出一个(或两个)参数是否等于(或大于等于、小于等于)某个特殊值的命题。

备择假设:与原假设逻辑相反的假设。

第一类错误(弃真错误):原假设 H 0 H_0 为真却被我们拒绝了,犯这种错误的概率用 α \alpha 表示,所以也称 α \alpha 错误.

第二类错误(取伪错误):原假设 H 0 H_0 为伪我们却没有拒绝,犯这种错误的概率用 β \beta 表示.所以也称 β \beta 错误.

P值:当原假设为真时,得到的样本数据或更极端数据的概率(贾俊平);在零假设下,检验统计量取其实现值及(沿着备选假设的方向)更加极端值的概率(吴喜之)。

几个问题


  • 原假设和备择假设哪一个是正确的?

原假设和备择假设哪一个正确,是确定性的,没有概率可言的,而可能犯错误的是人。涉及假设检验犯错误的概率,就是犯第一类错误的概率和犯第二类错误的概率,负责任的态度是无论做出什么决策,都应该给出该决策可能犯错误的概率。


  • 到底 p p 值要多小的时候才能拒绝原假设?

在一般的统计学教材中,使用最多的标准是,拒绝原假设的概率应该小于0.05,当然也可以是0.1或者0.01等等。这种事先规定的概率称为显著性水平,用字母 α \alpha 表示。 α \alpha 并不是越小越好,因为这很可能导致不容易拒绝原假设,使得犯第二类错误的概率增大。当 p p 值小于或等于 α \alpha 时,就拒绝零假设。所以 α \alpha 是所允许的犯第一类错误概率的最大值。无论统计学家用多大的 α \alpha 作为显著性水平,都不能脱离实际问题,统计显著不一定等于实际显著,反过来也一样。

实际上,很多统计软件只给出 p p 值,而不给出显著性水平,有很多方便之处。我们可以根据我们实际得到的 p p 值来减少显著性水平 α \alpha 以展现结果的精确性,这是没有害处的。比如,我身高161cm,我一般说我高于160cm,但我不愿意说我高于150cm,虽然这两种说法都没有错误,但是第一种说法,听起来更好听一些。


  • 为啥不能说接受原假设?

有些统计学教材中,会出现不能拒绝原假设,就“接受原假设”的情况,这种说法是不严格的。首先,如果我们说“接受原假设”,那么就要负责任地提出接受零假设时可能犯第二类错误的概率,但是,这只有在备择假设仅仅是一个与零假设不同的确定值(不是范围)时才有可能,而多数统计学教材中的备择假设是一个范围,这根本无法确定犯第二类错误的概率。在许多诸如应用回归分析等领域的教材书中,往往也把一系列不能拒绝零假设的检验,当成接受接受这些检验的通行证,比如,不能拒绝某样本的正态性,就默认为某样本是正态分布的。其次,不能拒绝这些零假设,仅仅说明根据所使用的检验方法(或检验统计量)和当前的数据,没有足够的证据拒绝这些原假设而已。因此,在不能拒绝零假设时,只能说,按照目前的证据和检验方法,不足以拒接零假设而已,而零假设仍然是一个数学假定。统计工作者必须给用户一个没有偏见的信息,而不是代替用户做没有指明风险的决策。

发布了219 篇原创文章 · 获赞 102 · 访问量 9万+

猜你喜欢

转载自blog.csdn.net/m0_37422217/article/details/105567698
今日推荐