总体方差与样本方差

今天在计算一类数据的协方差时遇到个问题。数据如下:
x1=(0,0,0)’
x2=(1,0,0)’
x3=(1,0,1)’
x4=(1,1,0)’
这本是一件很容易的事,但我手算后用Matlab的cov函数验算了一下,发现结果竟然不一样,于是按照协方差公式,一步步验算,终于在求方差这一步发现了问题:用var函数求的方差与手动算的不一样。于是doc var一看:

这里写图片描述

从画线处可以看到,当样本数为N时,matlab默认用N-1来归一化,以此来作为总体方差的无偏估计。那么问题就来了,总体方差与我们平时计算所用的方差(样本方差)有什么区别?
显然,若总体确定,总体的方差应该是确定的,但有时候总体一般很难得到,我们只能得到总体中的一些样本,从这些样本中求的方差叫做样本方差,我们就是要通过计算样本方差去估计总体方差。但是他们的计算方法有区别。对于样本方差来说,计算方法应该是这样:

s2=1n1i=1n(xim)2

其中m是样本均值。实际上,样本方差是对总体方差的一个无偏估计。
这就解释了为什么手算的协方差与Matlab算的不同,因为cov函数里面也是这样:

这里写图片描述

将var(x)改为var(x,1)就和我手算的结果一样了。

猜你喜欢

转载自blog.csdn.net/u013608424/article/details/72934078