数据分析系列教程之numpy(四)

前面几节讲了numpy中数据类型创建,选取,修改,今天是numpy的最后一节,继续讲一些更常见的一些计算方法

1、求和函数

求和函数,用sum(),当然下图中我是直接选取哪些数据,就对哪些数据求和

在这里插入图片描述

sum函数里面有参数,当然下面的函数同样也包含该参数axis,axis代表轴,axis=0表示求列之和,axis=1表示求行之和

在这里插入图片描述

2、求平均值函数

mean()函数求平均值,同样参数有axis

在这里插入图片描述

3、最大值最小值函数

分别是max()和min( )函数

在这里插入图片描述

4、最大值最小值之差函数

ptp()函数可以求最大值和最小值之差

在这里插入图片描述

上面的这些计算函数都是很常用的,其实都很简单,用法也一样,无非我们记住这些方法就好了,但是正因为简单,可能反而容易犯一些眼高手低的错误,所以我把这些方法以最简单的例子给大家计算运行出结果,让大家直接能一目了然看懂每个方法的作用

5、方差、标准差计算

为了能让大家清楚明了的看懂方差和标准差如何计算,给大家手动计算其计算方式和两者关系,相信大家一看应该就能明白

方差:比如按第一列来说,所有样本减去该列的均值,求平方,在求和,最后取平均数,即可计算出方差

标准差:方差开根号

在这里插入图片描述

6、这里给大家普及下,如何计算20的开平方?

方式一:python中**表示幂,开平方就是0.5次幂

方式二:利用math库中的sqrt方法求

在这里插入图片描述

对应到numpy的话,有std方法,计算标准差,也就是方差开平方后的值

在这里插入图片描述

7、方差、标准差概念和作用

概率论中方差用来度量样本数据和均值之间的偏离程度。方差是各个数据分别与其平均数之差的平方的和的平均数。

那么问题来了,既然有了方差来描述变量与均值的偏离程度,那又搞出来个标准差干什么呢?

方差与我们要处理的数据的量纲是不一致的,虽然能很好的描述数据与均值的偏离程度,但是处理结果是不符合我们的直观思维的。

举个例子:一个班级里有60个学生,平均成绩是70分,标准差是9,方差是81,成绩服从正态分布(前提条件),那么我们通过方差不能直观的确定班级学生与均值到底偏离了多少分,通过标准差我们就很直观的得到学生成绩分布在[61,79]范围的概率为0.6826,即约等于下图中的34.2%*2

在这里插入图片描述

学数据分析还是要有一定的数学知识为基础,慢慢的都会给大家讲这些数学概念和对应的一些数学函数,至此,numpy最常用的一些方法已经给大家提了很多,后面涉及一些具体应用的时候再继续补充其知识点

猜你喜欢

转载自blog.csdn.net/weixin_41666747/article/details/82793203