置信区间(confidence interval)

要理解置信区间,就要从统计学最基本最核心的思想去思考,那就是用样本估计总体。

置信水平(Confidence level)是指总体参数值落在样本统计值某一区内的概率;
而置信区间(confidence interval)是指在某一置信水平下,样本统计值与总体参数值间误差范围。
置信区间越大,置信水平越高。

一、置信区间的概念

1.1 置信区间

置信区间,就是一种区间估计

先来看看什么是点估计,什么是区间估计。

1.1.1 点估计与区间估计

以前很流行一种刮刮卡:
在这里插入图片描述
游戏规则是(假设只有一个大奖):

  • 大奖事先就固定好了,一定印在某一张刮刮卡上
  • 买了刮刮卡之后,刮开就知道自己是否中奖

那么我们起码有两种策略来刮奖:

  • 点估计:买一张,这就相当于你猜测这一张会中奖
  • 区间估计:买一盒,这就相当于你猜测这一盒里面会有某一张中奖

很显然区间估计的命中率会更高(当然费用会更高,因为风险降低了)。

%%%
当我们做某个试验时,没有办法完全消除误差,这种情况下,我们会给结果一个可接受的误差范围,统计学上叫置信区间,置信区间是随机变量,它根据所抽取的样本决定,每抽取一个样本就会有一个置信区间。

置信区间是指由样本统计量所构造的总体参数的估计区间。

置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)。

置信区间展现的是这个参数的真实值落在测量值(推测值)的周围的可信程度。

接下来,我们看看置信区间是如何进行区间估计的。

1.1.2 置信区间

我们通过对人类身高的估计来讲解什么是置信区间。

1.1.2.1 上帝视角

对于人类真实的平均身高,我们是没有办法知道的,因为几乎不可能把每个人都统计到。

但这个数据肯定是真实存在的,我们可以说,上帝知道。

在这里我们引入了上帝视角,即上帝看到的人类身高的真实分布。

在这里插入图片描述

1.1.2.2 点估计

作为愚蠢的人类,我们只能在人群中抽样统计:
在这里插入图片描述
在这里插入图片描述
区间估计可以改进此问题。

1.1.2.3 置信区间

置信区间,提供了一种区间估计的方法。

在这里插入图片描述
但是,和点估计比较:

  • 点估计和区间估计,都不知道哪个点或者哪个区间更好
  • 但是,按照 95 % 95\% 95%置信区间构造出来的区间,如果我构造出100个这样的区间,其中大约有95个会包含 μ \mu μ

这就好像用渔网捞鱼,我知道一百次网下去,大约会有95次网到我想要的鱼,但是我并不知道是不是现在这一网:
在这里插入图片描述
剩下的问题就是 95 % 95\% 95%置信区间是如何构造的。

1.1.2.4 95 % 95\% 95%置信区间

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.1.2.5 总结

总结一下:

  • 置信区间要求估计量是个常数
  • 95 % 95\% 95%也被称为置信水平,是统计中的一个习惯,可以根据应用进行调整

1.2 置信水平

置信区间包含总体平均值的概率

又称 置信度

eg:95%的置信水平表示:抽取的100个样本,有100个置信区间,其中有95个置信区间可能包含总体的真实平均值。
在这里插入图片描述

1.2.1 是不是置信水平越高越好

这个问题就要看你需要统计的是什么?经济效益是什么?通常情况下,95%被作为常用的置信度,原理就在于3西格玛控制(在一些严格的领域甚至会用到6西格玛),此时已经有很高的置信度了,那在往上去,随着置信度的上升,置信区间的跨度也就越大,对参数估计的精度必定降低。点估计就一个值,精度高,但置信度则低,精度与置信度相互的取舍则要全由分析者自行选择了。

1.3 计算置信区间的步骤

第一步:求一个样本的均值

第二步:计算出抽样误差。

人们经过实践,通常认为调查:
100个样本的抽样误差为±10%
500个样本的抽样误差为±5%
1,200个样本时的抽样误差为±3%

第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。

1.4 举例说明

美国Gallup(盖洛普)公司就消费者对美国产品质量的看法,对美国、德国和日本三国共计3,500名消费者(每个国家约1,200名)分别进行了调查,调查结果:有55%的美国人认为美国产品质量好,而只有26%的德国人和17%的日本人持同样看法。抽样误差为±3%,置信水平为95%。则这三个国家消费者的置信区间分别为:

国别样本均值抽样误差置信区间

美国55%±3%52%-58%
德国26%±3%23%-29%
日本17%±3%14%-20%

二、关于置信区间的宽窄

窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。

假设全班考试的平均分数为65分,则

置信区间 间隔宽窄度表达的意思
0-100分 100,宽,等于什么也没告诉你
30-80分 50,较窄,你能估出大概的平均分了(55分)
60-70分 10,窄,你几乎能判定全班的平均分了(65分)

三、样本量对置信区间的影响

影响:在置信水平固定的情况下,样本量越多,置信区间越窄。
下面是经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同):

样本量 置信区间 间隔宽窄度
100 50%—70% 20,宽
800 56.2%-63.2% 7,较窄
1,600 57.5%—63% 5.5,较窄
3,200 58.5%—62% 3.5,更窄

由上表得出:

  • 1、在置信水平相同的情况下,样本量越多,置信区间越窄。
  • 2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一倍(实践证明,样本量要增加4倍,置信区间才能变窄一倍),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。

通过置信区间的计算公式来验证置信区间与样本量的关系

  • 置信区间=样本的推断值±(可靠程度系数×)

从上述公式中可以看出:
在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。

四、置信水平对置信区间的影响

影响:在样本量相同的情况下,置信水平越高,置信区间越宽。

举例说明:美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。则两组数字的情况比较如下:

抽样误差 置信水平 置信区间 间隔宽窄度
±3% 95% 60%±3%=57%-63% 6宽
±2.3% 90% 60%±2.3%=57.7%-62.3% 4.6窄

由上表得出:
在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。

五、样本量对置信水平的影响

影响:在置信区间不变的情况下,样本量越多,置信水平越高。
举例说明:

置信区间 样本量 置信水平
52%-58% 1,200 95%

(前面美国盖洛普公司的例子)

https://www.zhihu.com/question/26419030/answer/103956460
https://zhuanlan.zhihu.com/p/38755140
https://zhuanlan.zhihu.com/p/110612323

猜你喜欢

转载自blog.csdn.net/Anne033/article/details/109739681