Udacity课程脉络-统计学基础(二)- t分布

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Napoleonxxx/article/details/82012004

前言

关于t分布背后的故事,可以参考这篇文章,讲的非常好。

如何理解t检验, t分布, t值

这篇文章的归纳的知识点如下:

  • why t-test ?
  • 自由度
  • 单尾t检验 & 双尾t检验
  • 影响t统计量
  • 单样本t检验
  • 单样本t检验栗子(地雀)
  • 相依样本
  • 相依样本例子
  • 总结
    • 效应量

why t-test

why t-test

在前面的课程中,我们知道总体参数μ和σ,但很多时候我们并不知道。我们通常只有样本,只能通过样本得出所有结论。在下两节课中,我们将通过样本得出样本均值与总体的区别有多大以及两个样本之间的区别有多大。在所有中心值衡量指标中我们通常使用均值,在此情形下,要对比的两个样本可以是独立样本或非独立样本。这两种样本都会有介绍。

t-test

处理样本数据时必须利用贝塞尔校正系数,根据样本标准偏差估算总体标准偏差。当我们想知道样本均值位于样本均值分布(即抽样分布)上的位置。如果我们知道总体参数,则可以判断该抽样分布的形状和参数。对于任何样本均值,我们都可以通过标准化找到该均值位于此分布上的位置,也就是说算出样本均值的z值。我们算出样本均值和μ之间的差别,再除以标准误差但现在标准误差取决于样本了,如果我们拥有的是样本,我们则无法再使用σ。因此我们得出的是新的分布,该分布更容易出错。这个分布叫做t分布,因为它更容易出错,所以更加分散。末端比正态分布要高。当样本量n增大时t分布更接近于正态分布,末端变的更矮,最后样本偏差s会更接近σ。

自由度

t分布用自由度来定义。

自由度

在总体中,当我们需要选择n个样本值时,我们需要满足一定的条件即第n个值必须确保这些指的和等于x拔乘以n。也就是说n-1个值可以随意变化,只要第n个值使得和为相同的值,从而达到相同的均值即可,称为有效取样数。因为样本标准偏差取决于x拔,自由度为n-1。

有人可能会问,如果总体标准偏差也使用x拔,为何要除以n呢?这是因为对于总体来说,我们无法像样本那样,用某些值代替其他值,因为总体的所有可能值已经定好了。

自由度是指在不影响给定限制条件的情况下,可以自由变换的信息的数量。可以将自由度视作估算其他信息时可有的独立信息数量在我们知道均值后,只有n-1个值是独立的。随着自由度的增大,t分布将更接近正态分布。

单尾t检验 & 双尾t检验

方法与正态分布单尾&双尾一致,只不过正态分布用z表查询,t分布用t表查询。

影响t统计量

影响t统计量

和z检验一样,当t统计量在任一方向远离0时,也就是说如果样本均值远离总体均值,我们就拒绝零假设。首先我们需要对比样本均值与总体均值,在这种情形下,t等于样本均值减去总体均值μ0,再除以标准误差,我们使用的是样本标准偏差,而不是σ除以平方根n

单样本t检验

one sample test

和之前提到的z检验一样,它是单样本t检验是因为我们只有一个样本,均值为x拔。我们想知道这个样本来自的总体是否与具有这个均值的总体显著不同。因此零假设是指:总体均值μ等于某个特定的值μ0。

当我们计算t统计量时,分子是样本均值与μ0的差,而样本均值是总体均值μ的点估计值。分母衡量的是总体均值与μ0之间按概率预测的区别,当我们知道α水平,t表显示了划分α水平的t临界值。如果t统计量大于t临界值或者负的t统计量小于划分α水平的负的t临界值,则拒绝零假设。

单样本t检验栗子(地雀)

地雀

相依样本

如果同一受试者参加两次测试,即为相依样本。

这叫做受试者内设计,示例一是每个受试者按随机顺序被分配到两个组。例如他们处在对照组,然后接受某种处理,或者他们接受两种治疗方法。另一个例子是每个人都接受了前期测试,然后接受了后期测试。还有一个例子是随着时间的增长情况亦即纵向研究,然后我们在某个时间点衡量每个受试者的变化,然后在另一个时间点再去衡量。当我们具有了这些受试者内设计,我们就拥有了成对数据。

下图的xi对应的是某个测试组即前期测试。某个时间点的衡量结果y值对应的是第二项处理即后期测试。我们要做的是衡量这些值之间的差别。我们将Di等于xi减去yi。和之前的单样本t检验的计算流程一样,只是我们使用的是D值。

Dependent t-test

相依样本例子

keyboard

有两款键盘布局各不相同的手机。假设研究人员想知道这些键盘布局对打字时拼错字的影响。为此25名参与者均使用了每个键盘类型。他们在30秒内打出了标准的20个单词文字消息,每个人使用没种键盘类型出现的错误数量被记录了下来。这些参与者被随机的分配到了首先使用的键盘类型。

效应量(Effect Size)

调查研究的一个重要方面是效应量。
在实验性研究中,或存在处理变量的研究中,效应量是指处理效应的大小,意思很直观。在非实验性研究中,效应量是指变量之间的关系强度。

在z检验或t检验中,最简单的效应衡量指标是均值差异。在z检验或单样本t检验中,均值差异等于x拔减去μ。也就是说不需要经过专门的训练,就知道其中的含义,这时候均值差异就很有用。

另一个系列叫相关度量,其中比较重要的一种叫r^2(即r squared)。r^2表示的是某个变量的变化比例,或百分比与另一个变量的关系。

猜你喜欢

转载自blog.csdn.net/Napoleonxxx/article/details/82012004