P值

　　一个统计指标，许多科学领域中的研究结果的意义均是由P值来判断的。它们被用来证明或驳回一个“零假设”：通常假定所测试的效果并不存在。
　　当P值越小，该实验结果是由纯粹的偶然所造成的可能性就越小。
　　
　　由于样本采集的有限性，他通常只能以小样本数来进行统计平均，不过在这研究的过程中，他发现小样本统计平均结果不满足他一开始认为的高斯分布。为了明白平均数精度与样本数的关系，Gosset尝试着去计算不同样本尺寸下的平均数精度，而这一问题也正是论文的研究核心。
　　他计算得到的结果包含在了他的T-table分布表中，而现在一般只要是接触过统计课程的人都会知道T分布，即用来描述不同样本数对于统计概率的影响，当样本数足够大的时候，就等同于标准正态分布(高斯分布)。

使用

　　Fisher带着一些武断性的选择α=0.05的概率值来衡量是否具有统计显著性，当 p值（统计学术语，原假设成立时得到与样本相同或者更极端结果的概率，P值越小，拒绝原假设的理由越充分，表明结果越显著）小于0.05时，我们拒绝原假设。
　　比如，一位研究人员想要确定一种新的教学方法是否有效，他可以选取一组新教学方案教学的学生和普通教学方案的学生的学习成绩做对比。如果接受新方法的学生的分数比那些没有接受新方法的学生的分数高出5%的机率（p值），那么Fisher就认为新教学方案是有效的。不过后来证明Fisher武断的选择α=0.05的概率值来衡量是否具有统计意义的逻辑是有缺陷的。
　　一个多世纪后，许多研究者认为Fisher选择α=0.05诱发了一个科学上的危机。诸如心理学、经济学和医学等学科上的实验结果，如果使用α=0.05作为判定阈值的话，那么将导致实验结论错误。

改进

　　使用α=0.005来作为新的阈值。
　　enjamin说:“虽然这样直接使用α=0.005解决方案并不完美，但已经可以在短期内做很多事。”正如提案的研究所表明的，使用α=0.005解决方案可以减少一半的经济学和心理学实验上的错误结果。
　　Benjamin承认选择α=0.005也带有一点武断性质，并同他的同事也讨论过其他更低的阈值，但是他认为α=0.005是符合逻辑的。Benjamin补充到，对于0.05阈值的共同解释——结果（原假设）有95%的可能性是正确的，但使用更先进的统计技术发现，这95%的机率实际上是更接近于p值等于0.005。
　　阈值从0.05更改到0.005只能挽救医学，心理学和经济学领域部分的研究结果，Benjamin的团队更希望医学研究人员、经济学家和心理学家能去正视现今他们领域中出现的科研诚信危机。

机器学习基础--math（10）--P值

P值

使用

改进

猜你喜欢