期末复习 第五、六章
第五章
- 大数定理
- 中心极限定理
-
大数定理:对于任意大于0的概率,只要重复独立实验的次数n充分大,几乎是必然发生的。
-
中心极限定理:
- 独立同分布的中心极限定理:均值为 μ \mu μ、方差为 σ 2 > 0 \sigma^2 > 0 σ2>0的独立同分布的随机变量 X i X_i Xi之和,当n足够大的时候近似服从 N ( μ , σ / n ) N(\mu, \sigma/n) N(μ,σ/n)
- 利亚普诺夫定理:无论各个随即变量 X k X_k Xk服从什么分布,只要满足定理的条件,那么当n很大的时候,他们的和近似服从正态分布
- 一个名字很长我不会念的定理:我也看不懂它在说什么
第六章
- 随机样本、箱线图
- 抽样分布
- χ 2 \chi^2 χ2分布
- t t t分布
- F F F分布
- 正态分布总体的样本均值与样本方差的分布
随机样本、箱线图
-
术语
总体:全部可能的取值
个体:每一个可能的取值
容量:总体中个体的数量
简单随机样本:n个服从同一个分布函数的随机变量
样本p分位数:至少有 n p np np个观察值小于等于 x p x_p xp,至少有 n ( 1 − p ) n(1-p) n(1−p)个观察值大于等于 x p x_p xp -
箱线图:由箱子和直线组成的图形,基于:最小值,第一四分位数,中位数,第三四分位数,最大值
中心位置:中位数所在的位置
散布程度:全部数据都在最大值与最小值间,区间较短表示点集中,反之较分散
对称性:看中心位置,在中间称为较为对称,在左边称之为向右倾斜,在右边称之为向左倾斜
抽样分布
在实际应用的时候并不是使用样本本身,而是针对不同的问题构造样本的适当函数
- 术语:
统计量:样本的函数
样本平均值:所有样本相加处以容量: X ‾ = 1 / n ∑ X i \overline{X}=1/n \sum{X_i} X=1/n∑Xi
样本方差: 1 / ( n − 1 ) ∑ ( X i − X ‾ ) 2 = 1 / ( n − 1 ) ( ∑ X i 2 − n X ‾ 2 ) 1/(n-1)\sum(X_i-\overline{X})^2=1/(n-1)(\sum{X_i^2}-n\overline{X}^2) 1/(n−1)∑(Xi−X)2=1/(n−1)(∑Xi2−nX2)
样本标准差:样本方差的平方根
样本k阶矩: A k = 1 / n ∑ X i k A_k = 1/n\sum{X_i^k} Ak=1/n∑Xik
样本k阶中心矩: B k = 1 / n ∑ ( X i k − X ‾ ) B_k=1/n\sum(X_i^k-\overline{X}) Bk=1/n∑(Xik−X)
经验分布函数:与总体分布函数 F ( x ) F(x) F(x)相对应
F n ( x ) = 1 / n ∗ S ( x ) F_n(x)=1/n*S(x) Fn(x)=1/n∗S(x)
其中 S ( x ) S(x) S(x)表示不大于 x x x的随机变量的个数
特殊的统计量分布
χ 2 \chi^2 χ2分布
χ 2 = ∑ n X i 2 \chi^2=\sum^n{X_i^2} χ2=∑nXi2, X i X_i Xi相互独立且 X i ∼ N ( 0 , 1 ) X_i\sim N(0, 1) Xi∼N(0,1)
记作: χ 2 ∼ χ 2 ( n ) \chi^2\sim\chi^2(n) χ2∼χ2(n)
称为:服从自由度为n的 χ 2 \chi^2 χ2分布
E ( χ 2 ) = n E(\chi^2)=n E(χ2)=n
D ( χ 2 ) = 2 n D(\chi^2)=2n D(χ2)=2n
可加性: X i 2 + X j 2 = X i + j 2 X_i^2+X_j^2=X_{i+j}^2 Xi2+Xj2=Xi+j2
上 α \alpha α分位点: P ( χ 2 > χ α 2 ( n ) ) = ∫ χ α 2 ( n ) f ( y ) d y = α P(\chi^2>\chi_{\alpha}^2(n))=\int_{\chi_{\alpha}^2(n)}f(y)dy=\alpha P(χ2>χα2(n))=∫χα2(n)f(y)dy=α
n小于40,查表
n大于40, χ α 2 ( n ) = 1 / 2 ( z α + ( 2 n − 1 ) ) 2 \chi_{\alpha}^2(n) = 1/2 (z_{\alpha}+\sqrt(2n-1))^2 χα2(n)=1/2(zα+(2n−1))2
其中, z α z_{\alpha} zα为标准正态分布的上 α \alpha α分位点
t分布
X ∼ N ( 0 , 1 ) X\sim N(0, 1) X∼N(0,1), Y ∼ χ 2 ( n ) Y\sim \chi^2(n) Y∼χ2(n),二者相互独立,
t = X / ( Y / n ) t = X/\sqrt(Y/n) t=X/(Y/n)
n充分大,近似于 N ( 0 , 1 ) N(0, 1) N(0,1)
n > 1 n>1 n>1, E ( T ) = 0 E(T)=0 E(T)=0
n > 2 n>2 n>2, D ( T ) = n / ( n − 2 ) D(T)=n/(n-2) D(T)=n/(n−2)
t 1 − α ( n ) = − t α ( n ) t_{1-\alpha}(n)=-t_{\alpha}(n) t1−α(n)=−tα(n)
上 α \alpha α分位点:n小于等于45查表,n大于45, t α ( n ) = z α t_{\alpha}(n)=z_{\alpha} tα(n)=zα
F分布
X ∼ χ 2 ( n i ) 、 Y ∼ χ 2 ( n 2 ) X\sim \chi^2(n_i)、Y\sim \chi^2(n_2) X∼χ2(ni)、Y∼χ2(n2),
F = ( U / n 1 ) / ( V / n 2 ) F=(U/n_1)/(V/n_2) F=(U/n1)/(V/n2)=> F ∼ F ( n 1 , n 2 ) F\sim F(n_1, n_2) F∼F(n1,n2)
1 / F ∼ F ( n 2 , n 1 ) 1/F\sim F(n_2, n_1) 1/F∼F(n2,n1)
n > 2 n>2 n>2, E ( F ) = n 2 / ( n 2 − 2 ) E(F)=n_2/(n_2-2) E(F)=n2/(n2−2)
n > 4 n>4 n>4, D ( F ) = ( 2 n 2 ( n 1 + n 2 − 2 ) ) / ( n 2 ( n 2 − 2 ) 2 ( n 2 − 4 ) ) D(F)=(2n_2(n_1+n_2-2))/(n_2(n_2-2)^2(n_2-4)) D(F)=(2n2(n1+n2−2))/(n2(n2−2)2(n2−4))
正态分布样本均值和样本方差的分布
X X X均值为 μ \mu μ、方差为 σ 2 \sigma^2 σ2, X ‾ \overline{X} X为样本均值, S 2 S^2 S2为样本方差
E ( X ‾ = μ E(\overline{X}=\mu E(X=μ, D ( X ‾ ) = σ 2 / n D(\overline{X})=\sigma^2/n D(X)=σ2/n
E ( S 2 ) = σ 2 E(S^2)=\sigma^2 E(S2)=σ2
- X ‾ ∼ N ( μ , σ 2 / n ) \overline{X}\sim N(\mu, \sigma^2/n) X∼N(μ,σ2/n)=> ( X ‾ − μ ) / ( σ / n ) ∼ N ( 0 , 1 ) (\overline{X}-\mu)/(\sigma/\sqrt{n})\sim N(0, 1) (X−μ)/(σ/n)∼N(0,1)
- ( n − 1 ) S 2 / σ 2 ∼ χ 2 ( n − 1 ) (n-1)S^2/\sigma^2\sim\chi^2(n-1) (n−1)S2/σ2∼χ2(n−1)
- S 2 S^2 S2与 X ‾ \overline{X} X独立
- ( X ‾ − μ ) / ( S / n ∼ t ( n − 1 ) (\overline{X}-\mu)/(S/\sqrt{n}\sim t(n-1) (X−μ)/(S/n∼t(n−1)
- ( S 1 2 / S 2 2 ) / ( σ 1 2 / σ 2 2 ) ∼ F ( n 1 − 1 , n 2 − 1 ) (S_1^2/S_2^2)/(\sigma_1^2/\sigma_2^2)\sim F(n_1-1, n_2-1) (S12/S22)/(σ12/σ22)∼F(n1−1,n2−1)
- σ 1 2 = σ 2 2 \sigma_1^2=\sigma_2^2 σ12=σ22时,公式太长了自己看课本