数理统计-5.3 统计量及其分布

统计量:设x1,x2,…,xn是取自总体的样本,若样本函数T=T(x1,x2,…,xn)不含有任何未知参数,则称T为统计量
抽样分布:统计量的分布称作抽样分布
统计量不依赖于未知参数,但它的分布是依赖于未知参数的

样本均值及其抽样分布:
设x1,x2,…,xn是取自总体的样本,其算术平均值称为样本均值
x一捌= (x1+x2+…+xn)/n=Sum(xi)/n
在分组样本场合中
x一捌= (x1·f1+x2·f2+…+xn·fn)/n,fi为xi的频数

若把样本中数据与样本均值之差称为偏差,则样本所有偏差之和为0,Sum(xi-(x一捌))=0

数据观测值与样本均值的偏差平方和最小,即在形如Sum(xi-c)^2的函数中,Sum(xi-(x一捌))最小,c为任意常数

设x1,x2,…,xn是来自于某个总体的样本,(x一捌)为样本均值
1、当总体分布为N(u,c^2),则(x一捌)的精确分布为N(u,c ^2/n)
2、当总体分布未知或不是正态分布,E(x)=u,D(x)=c^ 2存在,则在n较大时(x一捌)的渐进分布为N(u,c^2/n)
证明:
(1)利用卷积公式,可得知Sum(xi)~N(nu,nc^2)
由此可知(x一捌)~N(u,c^2/n)
(2)由中心极限定理,sqrt(n)*((x一捌)-u)/c——>N(0,1),这表明n较大时(x一捌)的渐进分布为N(u,c^2/n)

样本方差与样本标准差:
样本方差:设x1,x2,…,xn是来自于某个总体的样本,则它关于样本均值(x一捌)的平均偏差平方和为Sn2=Sum((xi-(x一捌))2)/n,Sn为其样本标准差
在n不大时,常用S2=Sum((xi-(x一捌))2)/(n-1)作为样本方差(无偏方差),在以后提到样本方差通常指的就是S^2
样本方差是度量样本散布大小的统计量,在它的定义中,n为样本量,Sum((xi-(x一捌))^2)为偏差平方和,n-1为偏差平方和的自由度,其含义是:在(x一捌)确定后,n个偏差x1-(x一捌),x2-(x一捌),…只有n-1的偏差可以自由变动,而第n个偏差不能自由变动,因为Sum(xi-(x一捌))=0
在分组样本场合中,样本方差的近似计算公式为
S^ 2=Sum(fi·(xi-(x一捌))^2)/(n-1),fi为xi的频数

样本的均值与方差
设x1,x2,…,xn为总体的一个样本,总体的期望为u,方差为c^2
E(x一捌)=(nu)/n=u
Var(x一捌)=Var(Sum(xi))/n^2=c ^2/n
Sum((xi-(x一捌))^2)=Sum(xi ^2)-n
(x一捌)
E(xi^ 2)=E^ 2(xi)+Var(xi)=u^2+c ^2
E((x一捌)^ 2)=E^ 2((x一捌))+Var((x一捌))=u^2+c ^2/n
E(Sum((xi-(x一捌))^ 2))=E(Sum(xi^ 2))-E(n*(x一捌))=n*(u^ 2+c^ 2)-n*(u^ 2+c^ 2/n)=(n-1)*c^2

k阶原点矩与k阶中心矩
原点矩:ak=Sum(xi)^k/n
中心矩:bk=Sum(xi-(x一捌))^k/n
1阶原点矩为期望
2阶中心矩为方差

样本偏度与峰度
偏度:Bs=b3/b2^1.5
偏度为0,样本完全对称
偏度小于0,样本左偏
偏度大于0,样本右偏
峰度:Bk=b4/b2^2-3
峰度小于0,样本比标正平坦
峰度大于0,样本比标正尖顶

次序统计量及其分布
设x1,x2,…,xn为总体的一个样本,x(i)称为该样本的第i个次序统计量,它的取值是将样本观测值由小到大排列后得到的第i个观测值
x(1)=min{xi}为该样本的最小次序统计量
x(n)=max{xi}为该样本的最大次序统计量

一个简单随机样本中,x1,x2,…,xn是独立分布的,而次序统计量x(1),x(2),…,x(n)则不独立,分布也不相同
证明如下:

单个次序统计量的分布

多个次序统计量及其函数的分布

样本分位数与样本中位数

箱线图:
Xmin,M0.25,M0.5,M0.75,Xmax

猜你喜欢

转载自blog.csdn.net/dc12499574/article/details/121272272