95% CI, 置信区间 Confidence Interval

什么是置信区间

　　置信区间又称估计区间，是用来估计参数的取值范围的。常见的52%-64%，或8-12，就是置信区间（估计区间）。

置信区间的概述

1、对于具有特定的发生概率的随机变量，其特定的价值区间：一个确定的数值范围（“一个区间”）。　　

2、在一定置信水平时，以测量结果为中心，包括总体均值在内的可信范围。

3、该区间包含了参数θ真值的可信程度。　　

4、参数的置信区间可以通过点估计量构造，也可以通过假设检验构造。

关于置信区间的宽窄

　　窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。

扫描二维码关注公众号，回复： 1776892 查看本文章

　　假设全班考试的平均分数为65分，则置信区间、间隔、宽窄度、表达的意思是：

　　0-100分 100 宽等于什么也没告诉你

　　30-80分 50 较窄你能估出大概的平均分了（55分）

　　60-70分 10 窄你几乎能判定全班的平均分了（65分）

置信区间与置信水平、样本量的关系

　　1、样本量对置信区间的影响：在置信水平固定的情况下，样本量越多，置信区间越窄。

　　实例分析：

　　经过实践计算的样本量与置信区间关系的变化表（假设置信水平相同）：

样本量	置信区间	间隔	宽窄度
100	50%-70%	20	宽
800	56.2%－63.2%	7	较窄
1,600	57.5%-63%	5.5	较窄
3,200	58.5%-62%	3.5	更窄

　　由上表得出:

　　1、在置信水平相同的情况下，样本量越多，置信区间越窄。

　　2、置信区间变窄的速度不像样本量增加的速度那么快，也就是说并不是样本量增加一倍，置信区间也变窄一倍（实践证明，样本量要增加4倍，置信区间才能变窄一倍），所以当样本量达到一个量时（通常是1,200，如上例三个国家各抽了1,200个消费者），就不再增加样本了。

　　通过置信区间的计算公式来验证置信区间与样本量的关系

　　置信区间=样本的推断值±（可靠程度系数× ）

　　从上述公式中可以看出：

　　1、在其他因素不变的情况下，样本量越多（大），置信区间越窄（小）。

　　2、置信水平对置信区间的影响：在样本量相同的情况下，置信水平越高，置信区间越宽。

　　实例分析：

　　美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中，有60%的人赞扬了总统的工作，抽样误差为±3%，置信水平为95%；如果将抽样误差减少为±2.3%，置信水平降到为90%。则两组数字的情况比较如下：

抽样误差	置信水平	置信区间	间隔	宽窄度
±3％	95％	60％±3％＝57％-63％	6	宽
±2.3％	90％	60％±2.3％＝57.7％-62.3％	4.6	窄

　　由上表得出:

　　在样本量相同的情况下（都是1,200人），置信水平越高(95%)，置信区间越宽。

通俗的讲：OR值是点估计，可信区间是区间估计。可信区间包含1，表示该因素对疾病的发生不起作用；可信区间大于1，表示该因素是一个“危险”因素。例如天气预报预计在10-20'C及15-16'C之间（95%可行度），则后者较前者可信度高。实际测定若为15.5'C,均落在2个可行度之间，说明可靠；若为25'C,落95%可行度之外，说明不可靠，处于5%的几率。95%上线位于左，下线位于右。

来源：http://wiki.mbalib.com/wiki/置信区间

95% CI, 置信区间 Confidence Interval

猜你喜欢