【看完这篇就够了!!!通俗易懂】置信度理解(95%的置信度、置信区间)

因为读论文时看到了这个概念,在很多实验中也算是一个评测指标了,但不是很理解。这是统计学中的概念,虽然我学过统计学,但是不记得这个概念了,重新来过吧,O(≧口≦)O
百度百科的专业术语比较难理解,我整合了很多人的解释再加上自己的理解希望能用最通俗易懂的话语把这个概念描述清楚。
虽然篇幅稍微有点长,但看完真的会彻底理解哦。
首先,在统计学中,我们每个人都知道的是,可以通过抽样对整体水平进行评估,也可以说是用测量值估计总体的真实值。举一个例子,我一直很想知道我市市民平均每天玩手机的时间是多少,当然肯定不可能把全市的人问一遍,毕竟有362.09万人。那么我们就可以进行抽样,选取一部分人来做调查。假设在我的能力范围内,我只能调查100个人,通过询问等方式,这100个人平均每天玩手机8h,那么我可以说通过抽样调查我市市民平均每天玩手机8小时吗?当然不能,那如果我再随机抽取100个人他们平均每天玩手机的时间是7h或者5h呢?我可以直接下结论吗?显然数据是不靠谱的,这就有种以偏概全的感觉,要知道,如果真的对362.09万人进行调查,肯定有一个真实的期望值,但具体是多少,说不好,也不知道。假如再来一个指标,或者可以理解为约束,在这里,我把这个指标定义为:对我所调查结果的相信度,设为几个等级,即有点相信(30%)【注:试验100次,有30次包含真实期望值,而不是这30次调查结果的值就等于真实期望值,因为总会有误差,不可能完完全全等于最终的期望值,就认为这个期望值根本无法知道吧。而这30次是30个置信区间,后面会讲,所以是包含期望值,包含!】,勉强相信(50%),相信(70%),非常相信(95%)。然后,把自己测的结果和真实结果做差值,拿这个差值与所设定的概率比较,公式是如果这个差值小于所设定的概率,假设是上面的95%,那么就可以说,我有95%的把握(即我非常相信)认为我调查的这个结果(假设是8h)与真实期望值是非常接近的。
所以,95%就是置信度。那么置信度是怎么来的?借用别人的一张图,我把我的例子套用在这张图上就好理解了。
在这里插入图片描述
首先理解置信区间:
可以参考这个链接,对置信区间进行了详细推理
https://www.zhihu.com/question/26419030
然后再套用一下:
大虚线是真实期望值8h,上面的短线是置信区间,假设我调查100次,这100次中有95次(即100个置信区间有95个置信区间)都包括真实值8h,那么置信度就是95%。

然后一个网友的回答也可以帮助理解:置信区间是一个随机的区间。所谓随机,就是指端点为随机变量,这个随机变量通常是一个统计量,当抽取不同的样本时就对应不同的值,从而对应不同的区间。对于某些样本来说,对应的区间包含参数真值,另一些不包含。若在100次随机抽样中构造的100个区间如果95次包含了参数真值,那么置信度为95%.
链接:https://www.zhihu.com/question/26419030/answer/81409702
看完上面这些再来看下概念:
**置信度:**以测量值为中心,在一定范围内,真值出现在该范围内的几率。一般设定95%,是通常情况下置信度(置信水平)的设定值。
置信区间:在某一置信度下,以测量值为中心,真值出现的范围。一定概率下真值的取值范围(可靠范围)称为置信区间。其概率称为置信概率或置信度(置信水平)。

看完这些,一定能够理解了,再去看看专业术语的概念,会豁然开朗!
参考:
https://www.zhihu.com/question/20183513/answer/15040378
https://wenku.baidu.com/view/cf67d1da360cba1aa811da23.html

猜你喜欢

转载自blog.csdn.net/laozaoxiaowanzi/article/details/107205616