t检验学习[转载]

转自:https://blog.csdn.net/m0_37777649/article/details/74937242

1.什么是T检验?

T检验是假设检验的一种,又叫student t检验(Student’s t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。 
T检验用于检验两个总体的均值差异是否显著。

 2.单总体t检验例子

“超级引擎”工厂是一家专门生产汽车引擎的工厂,根据政府发布的新排放要求,引擎排放平均值应低于20ppm,如何证明生产的引擎是否达标呢?(排放量的均值小于20ppm)

 2.1思路1

一个直接的想法就是,把这个工厂所有的引擎都测试一下,然后求一下排放平均值就好了。比如工厂生产了10个引擎,排放水平如下:
15.6 16.2 22.5 20.5 16.4
19.4 16.6 17.9 12.7 13.9
排放平均值为
(15.6+16.2+22.5+20.5+16.4+19.4+16.6+17.9+12.7+13.9)/10=17.17(15.6+16.2+22.5+20.5+16.4+19.4+16.6+17.9+12.7+13.9)/10=17.17
小于政府规定的20ppm,合格!

这也太简单了!

然而,随着“超级引擎”工厂规模逐渐增大,每天可以生产出10万个引擎,如果把每个引擎都测试一遍,估计要累死人了……
有没有更好的方法?

2.2思路2

由于引擎数量太多,把所有引擎测试一遍太麻烦了,一个好想法:
可不可以采用“反证法”?先假设所有引擎排放量的均值为μμ,然后随机抽取10个引擎,看看这10个引擎的排放量均值与假设是否相符,如果相符,则认为假设是正确的,反之认为假设是错误的。这样,就可以通过一小部分数据推测数据的总体.

具体怎么操作呢?

先建立两个假设,分别为:
H0:μ⩾20 (原假设)
H1:μ<20 (备择假设)
【μ代表总体(所有引擎的排放量)均值】

在原假设成立的基础上,求出”取得样本均值或者更极端的均值”的概率,如果概率很大,就倾向于认为原假设H0是正确的,如果概率很小,就倾向于认为原假设H0是错误的,从而接受备择假设H1。

那么如何求这个概率p呢?
这就需要引入一个概念——统计量
简单的讲,统计量就类似于用样本已知的信息(如样本均值,样本标准差)构建的一个“标准得分”,这个“标准得分”可以让我们求出概率p

由于样本服从正态分布,且样本数量较小(10),所以这里要用到的统计量为t统计量,公式如下:

现在抽取出10台引擎供测试使用,每一台的排放水平如下: 
15.6 16.2 22.5 20.5 16.4 
19.4 16.6 17.9 12.7 13.9 

样本方差:

样本标准差:

我们把原假设μ20 拆分,先考虑μ=20μ=20的情况 
将数值带入t统计量公式中,可以得出

由于t统计量服从自由度为9的t分布,我们可以求出t统计量小于-3.00的概率,即下图阴影部分面积

2.3P值——检验结果讨论

通过查询t分位数表(见附录),我们可知,当自由度为9时,t统计量小于-2.821的概率为1%,而我们求得的t统计量为-3.00,所以t统计量小于-3.00的概率比1%还要小(因为-3.00在-2.81的左边,所以阴影面积更小)。
这个概率值通常被称作“p值”,即在原假设成立的前提下,取得“像样本这样,或比样本更加极端的数据”的概率。

3.第一类错误与第二类错误

在例1中,我们认为1%的概率很小,所以更倾向于认为原假设是错误的,从而接受了备择假设。但这样的判断是准确的吗?为了探讨这个问题,我们考虑以下四种情况:



猜你喜欢

转载自www.cnblogs.com/BlueBlueSea/p/10030034.html