《统计学:从数据到结论》学习笔记(part3)--任何统计量,只要人们觉得合适就可以当成估计量

学习笔记
学习书籍:《统计学:从数据到结论》-吴喜之;
参考书目:《统计学》-贾俊平


用估计量估计总体参数

我们都知道样本的函数称之为统计量,而用于估计的统计量则被称为估计量。由于统计量对于不同的样本取值不同,所以估计量就是随机变量,并有其分布。如果样本已经得到,把数据带入后,估计量就有了一个数值,也就不是随机的了,这个数值就是该估计量的一个实现或取值,也称为一个估计值。

点估计和区间估计

这里介绍两种估计,一种是点估计,也就是用估计量的实现值来近似相应的总体参数。另一种是区间估计,它是包括估计量在内的一个区间,该区间很有可能包含总体参数。

点估计

任何统计量,只要人们觉得合适就可以当成估计量。我们知道的最常用的估计量就是:样本均值、样本标准差等。

那么什么是好估计量的标准呢?一种统计量称为无偏估计量。所谓无偏性,就是:虽然每个样本产生的估计量的取值不一定等于参数,但当抽取大量样本时,那些样本产生的估计量的均值会接近真正要估计的假定分布的参数。严格来说,如果估计量的数学期望等于欲估计的总体参数,则该估计量称为该参数的无偏估计量。因此,无偏性仅仅是非常多次重复抽样时的一个渐进概念。在无偏估计量中,人们还希望找寻方差最小的估计量,称为最小方差无偏估计量,方差小则说明反复抽样产生的许多估计值差别不大,因此更加精确。

区间估计

当描述一个人的身高时,我们不会说,某人高180.2cm,而可能会说,某人身高在175 ~ 185之间,这时,我们提供的这个范围就是某种区间估计。在抽样调查中,我们也常用到点估计加区间估计的说法。比如:某人的支持率为80%,误差为 ± 4 \pm 4 %,置信度为95%.

这种说法意味着:支持率为80%是样本比例作为总体比例 p p 的点估计; 估计范围在80% ± 4 \pm 4 %,即区间为(76%, 84%); 如果以类似的方式,重复大量抽取样本,产生的大量区间中,有些会覆盖真正的总体比例 p p ,而有些则不会,但这些区间中大约有95%会覆盖真正的总体比例。

这样得到的区间,被称为总体比例 p p 的置信度为95%的置信区间,这里的置信度又称为置信水平或置信系数。显然,置信度又是一个大量重复抽样时的渐进概念。

在这里,我们得到的区间(76%, 84%)是固定的,而总体比例 p p 也是固定的,只不过未知而已。因此只有两种可能,要么这个区间包含总体比例 p p ,要么不总体比例 p p ,这当中没有概率可言。

事实上,置信区间都是由统计量来确定的,依样本而变,是随机变量。因此,可以说,构造置信度为100*(1- α \alpha )%的随机区间,以1- α \alpha 的概率覆盖待估参数,但该区间相应于一个样本的实现值,就是固定的了,无法知道其是否真正覆盖需要估计的参数。

发布了219 篇原创文章 · 获赞 102 · 访问量 9万+

猜你喜欢

转载自blog.csdn.net/m0_37422217/article/details/105546376
今日推荐