python pandas VS numpy

两个包都有类似的数据分析工具,但是就细节上有时候也有差别。所以在切换时候需要注意。
  1. 两个包的函数methods在np.nan的处理上有区别。
  2. 如果是np的methods,比如我们要计算标准差,如果array里面有nan缺失值,那么返回的是nan。
  3. 但是如果我们是对于dataFrame求标准差,如果有nan,返回的是去掉nan之后序列中其他数字的标准差。
  4. std函数本身也有一个差异:np.std里面有一个参数可以增加:ddof=1。default情况下,ddof=0,标准差计算时候用的分母是等于样本数量的,如果ddof=1,则返回的是无偏的标准差,使用的分母等于样本数量减去1,也就是统计上用的标准差。
  5. pd包里面的method std直接返回的是后面的标准差,是统计意义上的标准差。

猜你喜欢

转载自blog.csdn.net/henbile/article/details/79498769