统计学知识回顾（二） - 代码天地

统计学知识回顾（二）

其他 2019-03-03 16:30:35 阅读次数: 0

统计学知识回顾（二）

中心极限定理
样本均值的抽样分布

偏度
峰度

均值标准误差
伯努利分布
置信区间
小结

中心极限定理

任何具有良好定义的具有均值与标准差的分布，随机取出 m 组样本量为 n 的样本。只要样本量 n 足够大，这些样本的均值就收敛于正态分布。

样本均值的抽样分布

即原分布的抽样所得均值形成的分布

偏度

正偏态分布：右侧尾部较长
负偏态分布：左侧尾部较长

峰度

正峰态：曲线更陡峭，尾部较长
负峰态：曲线更平缓，尾部较短

抽样样本容量越大，抽样分布均值形成的分布就越趋近于正态分布，标准差越小，曲线越紧凑

均值标准误差

抽样分布均值的分布标准差
公式： $\sigma _{\overline{X}} = \frac{\sigma} {\sqrt{n}}$

上面所提到的基础信息可以帮助我们在分布未知的情形下，利用中心极限定理来计算概率。具体步骤为：

根据中心极限定理可知，在样本量足够大的前提下，原分布总体均值可近似等同于抽样分布总体均值，并通过样本量与总体标准差计算出均值标准误差
计算 Z-分数，并通过查表确认偏离中心的距离，从而确定概率。注意分数表中特定的Z-分数值对应的概率为左开右闭区间

伯努利分布

又名 0-1 分布，是一个离散型分布。
统计量：
- $\mu$ = p
- $\sigma^{2}$ = p(1-p)

置信区间

即以概率 p 成立的误差区间。与之相对应的是置信水平，常常取值0.05。
从均值标准误差的公式可以看出，抽样样本量越大，对应的标准差越小。则在同样的置信水平下，误差区间就越小，得到的估计值就越精确。例如在前面的学习当中，我们可以得知在样本均值落在两个标准差区间内的概率约为95%，此时若提高样本量，则标准差变小，估计值所在的范围也就越小，自然就越精确。

小结

在计算概率时，要理清样本均值、总体均值、抽样分布均值三者的关系。
- 样本均值是从总体中抽样所得样本的均值，样本的标准差也只是对总体的一个估计值，不完全相等
- 在样本量足够大的前提下，抽样分布均值趋近于总体均值
- 同样的置信水平下，可以通过增加样本量来提高准确度

猜你喜欢

转载自blog.csdn.net/qq_40819816/article/details/88046921

统计学知识回顾（二）

统计学知识回顾（一）

统计学知识回顾（三）

统计学基本知识二

统计学知识

统计学知识

统计学（二）

统计学基础知识（二）---推断统计学（Inferential Statistics）

统计学知识梳理

统计学知识总结

【统计学】论统计学知识点

统计学笔记(二)

统计学基础二

Python统计学（二）

统计学基本知识

统计学基础知识note

概率和统计学知识汇总

统计学基本知识三

统计学基本知识一

统计学知识点

《统计学》基础知识归纳

统计学基础知识

统计学--基本知识

统计学基本知识四

统计学知识大梳理

多元统计学基础知识

箱线图统计学知识

利用python回顾统计学中的基础概念（全）

统计学回顾

【统计学】第二章

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)