置信区间,统计量

关键字:置信区间

1.置信区间

1.1.作用:描述一个区间有多大的概率包含未知参数

1.2.定义

    设母体的概率函数为f(x;seta),seta为未知参数,有一个取自母体的子样,字样有n个数据。如果对事先给定的a,0<a<1,存在两个统计量seta1和seta2,使得P(seta1<seta<seta2)=1-a,即seta落在seta1和seta2之间的概率为1-a,就称区间(seta1,seta2)为置信度为1-a的置信区间,seta1,seta2分别是置信下界和上界。

1.3.寻找置信区间的步骤

    3.1 寻找一个函数,它与子样有关,只包含seta这个未知参数而没有其他参数。这个函数服从某个常见的,方便求出的分布,比如正态分布,卡方分布等等。

    3.2 对于给定的1-a,确定分位点

    3.3 利用不等式变形,求出seta的范围,即为置信下界和上界。(概率论与数理统计P335开始)

例子:

子样均值是母体均值的点估计,那么可以构造子样函数,u服从标准正态分布,可以根据u的表计算给定a的置信区间

1.4 作用

    是有样本统计量所构造的总体参数的估计区间,展示参数的真实值有一定的概率落在测试结果周围的概率

2.统计量:

2.1 定义

    包含了样本总体信息的变量,只与样本有关,比如均值,方差,样本矩(比如k阶原点矩,k阶中心矩,也叫枢轴量)

2.2 统计量的一种:次序统计量

    把x1,x2,..,xn按从小到大排列为x11,x22,..,xnn,那么最小顺序统计量为x11,最大顺序统计量为xnn,差距(Range)为xnn-x11,四分位为iql=X(0.75n)-X(0.25),就是第0.75n的次序统计量减去0.25n的次序统计量

    x1,...,xn是独立同分布的,但是x11,...,xnn不独立分布也不相同,因为实际上是比较它们的大小,只要一个变化了,对其他的数据都会产生影响,影响他们的位置,所以不是独立同分布的。



猜你喜欢

转载自blog.csdn.net/qq_40597317/article/details/80639885