《统计学：从数据到结论》学习笔记(part3)--任何统计量，只要人们觉得合适就可以当成估计量

学习笔记
学习书籍：《统计学：从数据到结论》-吴喜之；
参考书目：《统计学》-贾俊平

用估计量估计总体参数

我们都知道样本的函数称之为统计量，而用于估计的统计量则被称为估计量。由于统计量对于不同的样本取值不同，所以估计量就是随机变量，并有其分布。如果样本已经得到，把数据带入后，估计量就有了一个数值，也就不是随机的了，这个数值就是该估计量的一个实现或取值，也称为一个估计值。

点估计和区间估计

这里介绍两种估计，一种是点估计，也就是用估计量的实现值来近似相应的总体参数。另一种是区间估计，它是包括估计量在内的一个区间，该区间很有可能包含总体参数。

点估计

任何统计量，只要人们觉得合适就可以当成估计量。我们知道的最常用的估计量就是：样本均值、样本标准差等。

那么什么是好估计量的标准呢？一种统计量称为无偏估计量。所谓无偏性，就是：虽然每个样本产生的估计量的取值不一定等于参数，但当抽取大量样本时，那些样本产生的估计量的均值会接近真正要估计的假定分布的参数。严格来说，如果估计量的数学期望等于欲估计的总体参数，则该估计量称为该参数的无偏估计量。因此，无偏性仅仅是非常多次重复抽样时的一个渐进概念。在无偏估计量中，人们还希望找寻方差最小的估计量，称为最小方差无偏估计量，方差小则说明反复抽样产生的许多估计值差别不大，因此更加精确。

区间估计

当描述一个人的身高时，我们不会说，某人高180.2cm，而可能会说，某人身高在175 ~ 185之间，这时，我们提供的这个范围就是某种区间估计。在抽样调查中，我们也常用到点估计加区间估计的说法。比如：某人的支持率为80%,误差为 $\pm 4$ %,置信度为95%.

这种说法意味着:支持率为80%是样本比例作为总体比例 $p$ 的点估计; 估计范围在80% $\pm 4$ %,即区间为(76%, 84%); 如果以类似的方式，重复大量抽取样本，产生的大量区间中，有些会覆盖真正的总体比例 $p$ ,而有些则不会，但这些区间中大约有95%会覆盖真正的总体比例。

这样得到的区间，被称为总体比例 $p$ 的置信度为95%的置信区间，这里的置信度又称为置信水平或置信系数。显然，置信度又是一个大量重复抽样时的渐进概念。

在这里，我们得到的区间(76%, 84%)是固定的，而总体比例 $p$ 也是固定的，只不过未知而已。因此只有两种可能，要么这个区间包含总体比例 $p$ ，要么不总体比例 $p$ ，这当中没有概率可言。

事实上，置信区间都是由统计量来确定的，依样本而变，是随机变量。因此，可以说，构造置信度为100*(1- $\alpha$ )%的随机区间，以1- $\alpha$ 的概率覆盖待估参数，但该区间相应于一个样本的实现值，就是固定的了，无法知道其是否真正覆盖需要估计的参数。

山羊菌

发布了219 篇原创文章 · 获赞 102 · 访问量 9万+

私信关注