统计学知识梳理(二)中心极限定理、置信区间

一、中心极限定理

1、什么是中心极限定理

中心极限定理是说:样本的平均值约等于总体的平均值。
不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。
这里假设一个分布如图所示:

在这里插入图片描述
取样本容量n=4,

S 1 = [ 1 , 1 , 3 , 6 ] x 1 = 2.75 S 2 = [ 3 , 4 , 3 , 1 ] x 2 = 2.75 S 3 = [ 1 , 1 , 6 , 6 ] x 3 = 3.5 S 10000 \begin{array}{l}{S_{1}=[1,1,3,6] \quad\overline{x}_{1}=2.75} \\ {S_{2}=[3,4,3,1] \quad \overline{x}_{2}=2.75} \\ {S_{3}=[1,1,6,6] \quad \overline{x}_{3}=3.5}\end{array}\\ ……\\ S_{10000}
将10000个点都画到图上后,结果近似于正态分布,并且这个正态分布以u为均值。
当样本容量增大后,如n=20,将更接近正态分布,且标准差变小了。

可以在这个网站上模拟实验:
在这里插入图片描述
奇妙的地方就在于我们可以从任意疯狂的分布中取任意数量的样本值n,然后取样本均值画到图上,无限次后会得到完美的正态分布(也可以是样本和,不一定要平均值)。生活中有很多随机过程概率分布无法预料,但根据中心极限定理,我们通过样本均值分布得到有规律可循的正态分布。

根据中心极限定理,我们可以得出的2个结论是:1.可以用样本来估计总体,任何一个样本的平均值将会约等于其所在总体的平均值。
2.当取样次数趋向于无穷时,样本平均值呈正态分布

那么如何用样本来估计总体呢?

2、如何用样本估计总体?

如何确定取样后的方差 σ x 2 \sigma_{\overline{x}}^{2} 与原方差 σ 2 {\sigma^{2}} 的关系呢?通过实验得出:
σ x 2 = σ 2 n \sigma_{\overline{x}}^{2}=\frac{\sigma^{2}}{n}

根据这个关系,我们可以在没有办法得到总体全部数据的情况下,用样本来估计总体。

如果我们掌握了某个正确抽取样本的平均值和标准差,就能对估计出总体的平均值和标准差。

二、置信区间

例题:从农场收获的20万个苹果中抽取36个作为样本,样本中苹果的均值是112g,标准差为40g,问20万个苹果的重量均值处在100g到124g之间的概率是多少?
分析:不断地从总体中取容量为36的样本,然后分别求样本均值,样本均值呈现正态分布。

猜你喜欢

转载自blog.csdn.net/weixin_42517469/article/details/89047725