第三章、估计

统计推断

估计（第三章）
假设检验（第四章）

随机变量

离散变量：取值有限
连续变量：取值是一个区间内的连续值

样本均值和方差

格利文科定理：随着样本的增加，经验分布函数随着样本的增加而收敛于其真实的分布函数。即，可以用样本的均值代替总体的均值，样本的方差代替总体的方差。

\bar{X} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}

$\bar{X} = \frac{1}{n}\sum_{i=1}^{n}X_i$

s^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \bar{X})^{2}

$s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2$

抽样分布复习

卡方分布(n为自由度)

$X_{i} \sim N (0, 1) X = \sum_{i = 1}^{n} X_{i}^{2}$ $X_i \sim N(0,1)\ \ \ \ \ X = \sum_{i=1}^{n}X_i^2$

$X \sim χ^{2} (n)$ $X \sim \chi^2(n)$

$E (X) = n D (X) = 2 n$ $E(X) = n\ \ \ D(X) = 2n$
t分布
$X \sim N (0, 1) Y \sim χ^{2} (n)$ $X \sim N(0,1)\ \ \ \ Y \sim \chi^2(n)$
$\frac{X}{\sqrt{\frac{Y}{n}}} \sim t (n)$ $\frac{X}{\sqrt{\frac{Y}{n}}} \sim t(n)$
F分布

$X \sim χ^{2} (n) Y \sim χ^{2} (m)$ $X \sim \chi^2(n)\ \ \ \ Y \sim \chi^2(m)$

$\frac{\frac{X}{n}}{\frac{Y}{m}} \sim F (n, m)$ $\frac{\frac{X}{n}}{\frac{Y}{m}} \sim F(n,m)$

均值和方差的点估计

根据格利文科定理，用样本的xx代替总体的xx。

均值和方差的区间估计

置信区间：在某种程度上确信这个区间会包含真正的总体参数
置信水平（置信度）：1-α
显著性水平：α
中心极限定理与拉普拉斯极限定理：
- 独立同分布的中心极限定理
  
  独立同分布的随机变量序列Xi，E(Xi) = μ,D(Xi)=σ2,则
$lim_{n \to \infty} P {\frac{\sum_{i = 1}^{n} X_{i} - n μ}{\sqrt{n} σ}} = ϕ (x)$

即：

$\frac{\sum_{i = 1}^{n} X_{i} - n μ}{\sqrt{n} σ} \sim N (0, 1)$

$\frac{\bar{X} - μ}{σ / \sqrt{n}} \sim N (μ, \frac{σ^{2}}{n}) *$

ps.*式子即为正态单样本总体的一个抽样分布。
- 拉普拉斯中心极限定理
  
  X~B(n,p)，则对于有限区间(a,b)：
$lim_{n \to \infty} P {a < \frac{x_{n} - n p}{\sqrt{n p (1 - p)}} \leq b} = ϕ (b) - ϕ (a)$

即：

$\frac{X_{n} - n p}{\sqrt{n p (1 - p)}} \sim N (0, 1)$

$\frac{\frac{X_{n}}{n} - p}{\sqrt{p (1 - p) / n}} \sim N (0, 1)$
均值的区间估计：
- 正态总体，方差σ已知（N）：根据独立同分布的中心极限定理，样本均值服从以下的分布
  $\frac{\bar{X} - μ}{σ / \sqrt{n}} \sim N (0, 1) ⟺ \bar{X} \sim N (μ, \frac{σ^{2}}{n})$ $\frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1) \Longleftrightarrow \bar{X} \sim N(\mu,\frac{\sigma^2}{n})$
$- z_{\frac{α}{2}} \leq \frac{\bar{X} - μ}{σ / \sqrt{n}} \leq z_{\frac{α}{2}}$

$⟹ \bar{X} - \frac{σ}{\sqrt{n}} z_{\frac{α}{2}} \leq μ \leq \bar{X} + \frac{σ}{\sqrt{n}} z_{\frac{α}{2}}$
- 正态总体，方差σ未知（t）：
$\frac{\bar{X} - μ}{s / \sqrt{n}} \sim t (n)$

$- t_{\frac{α}{2}} \leq \frac{\bar{X} - μ}{s / \sqrt{n}} \leq t_{\frac{α}{2}}$

$⟹ \bar{X} - \frac{σ}{\sqrt{n}} z_{\frac{α}{2}} \leq μ \leq \bar{X} + \frac{σ}{\sqrt{n}} t_{\frac{α}{2}}$
- 总体比例：依据拉普拉斯定理，p为统计的频率，π为总体的概率，可得
$\frac{p - π}{\sqrt{p (1 - p) / n}} \sim N (0, 1)$

03 估计

第三章、估计

统计推断

随机变量

样本均值和方差

抽样分布复习

均值和方差的点估计

均值和方差的区间估计

猜你喜欢