Pandas 与 Numpy 中的std() var() 区别

方差(Variance):一个随机变量方差描述的是它的离散程度,也就是该变量离其期望值的距离。将各个误差将之平方(而非取绝对值,使之肯定为正数),相加之后再除以总数。公式如下:

\operatorname{Var}(X) = \operatorname{E}\left[(X - \mu)^2 \right]

pandas官方文档对 var() 定义:DataFrame.var(axis=Noneskipna=Nonelevel=Noneddof=1numeric_only=None**kwargs)

pandas 默认 ddof=1, 即分母为N-1,这样的样本方差是总体方差的无偏估计。这被称为贝塞尔修正。

{\displaystyle s^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}}

numpy官方文档var() 定义: numpy.var(aaxis=Nonedtype=Noneout=Noneddof=0keepdims=<no value>)

numpy默认 ddof=0, 即分母为N。

标准差(又称标准偏差、均方差,英语:Standard Deviation,缩写SD),数学符号σ(sigma),在概率统计中最常使用作为测量一组数值的离散程度之用。标准差定义:为方差算术平方根,反映组内个体间的离散程度;标准差与期望值之比为标准离差率

pandas官方文档对 std() 定义:DataFrame.std(axis=Noneskipna=Nonelevel=Noneddof=1numeric_only=None**kwargs)

numpy.std(aaxis=Nonedtype=Noneout=Noneddof=0keepdims=<no value>)

\ SD= \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}

发布了16 篇原创文章 · 获赞 1 · 访问量 1578

猜你喜欢

转载自blog.csdn.net/weixin_41300650/article/details/90664568
今日推荐