0基础利用python数据分析----Numpy4统计分析

Numpy的统计分析:

文件的读写:

在Ipython中,对csv、txt、excel文件的读写要利用Numpy模块会很方便:

 

图2所示,如果你想导入CSV或者txt文件中的数据,可以直接用.loadtxt()函数直接导入,并可以直接设置导入的列,并用多个变量去接收他。

Numpy股价分析:

利用Numpy可以对数据进行统计分析,各种计算,很牛X:

1、计算加权成交量加权平均价格:

利用average可以计算成交量加权平均价格,(当某个价格成交量越大,它的权重就越高),VWAP是以成交量为权重计算出来的加权平均数,

源数据是这样的,第一个图片上的代码含义可以这样理解:

导入相应的数据后,咱们开始计算,arr1变量的数据是价格,arr2是成交量:

直接调用average函数可以计算加权平均价。。

利用mean函数计算平均数:

通过调用Numpy里面的mean函数可以直接计算一个数组的平均数:

在numpy中计算函数调用方法基本都是用np.+函数名,然后在括号内传入想要计算的数组。如果你想输出内容的时候想要多输出一些说明或者其他语言的话就这么干:

计算数组的最大值,和最小值:

上图所示,np.max就是求一个数组的最大值,np.min就是求该数组的最小值,我们发现大部分函数通过英文字面的意思咱们可以大概的理解该函数的作用。

计算数组的极差:

极差的概念非常好理解,就是一个数组的最大值减去最小值,有的时候也叫极值也有其他叫法:

计算数组的中位数:

中位数的概念也比较好理解,可以把中位数理解为该数组的最中间位置的数值,中位数的算法有两种:

第一种当你的数组元素个数是奇数的情况下,你需要先知道数组的元素个数,然后对该数组的元素进行排列,找出处于中间位置的元素,这个元素就是该数组的中位数;例如,1,3,4,5,6,7,9这七个数字,在他最中间位置的元素是第4个元素,所以该数组的中位数就是5。

第二种当你的数组元素个数是偶数的情况下,还是先求出元素的个数,然后对该数组的元素进行排列,找到最中间位置的两个元素,因为是偶数,所以中间的元素会有两个,把这两个元素相加然后除以2,得出的结果就是该偶数数组的中位数,例如:1,2,5,8,7,9,2,8   首先这个数组不是按照顺序排列的,先对他进行排列,结果为 1,2,2,5,7,8,8,9 ,找出最中间的两个元素是5和7,将两个元素相加除以2, 12/2 = 6 所以该数组的中位数就是6。

接下来咱们看一下numpy中如何求出一个数组的中位数。

上图所示,第一组数据元素个数为奇数,  第二组数据元素个数为偶数。

计算数组的方差:

方差就是一个数组的标准差的平方,它的作用是描述一个数组的波动范围,就好比你要买一只股票,就可以通过方差的大小来观测投资该股票的投资风险,方差越大,风险也大,收益率也可能会更高,方差越小风险越小,在这个调用numpy中的函数基本用法都相同,用函数名()加上数组,就可以计算,计算方差的函数是 var():

计算数组的标准差:

标准差的作用是描述一个数组每个元素距离平均值的大小,在这里我们需要调用的函数是std():

上图所示,第一个红色剪头支出的其实就是计算出该数组的标准差的方法了,第二个箭头,计算的是方差,因为方差就是标准差的平方,所以该数值等于方差。

计算虽有元素的累积和与阶乘:

图中cumsum函数是求该数组的累积和,累积和就是把数组中所有元素从前加到后的和,阶乘跟累积和相似,只不过运算时用乘法运算,不是求和。

给数组排序:

利用numpy中的 msort 或 sort() 函数可以对数组进行排序功能:


                                                                     numpy基础函数的用法暂时先介绍到这里,以后有了新的了解,小弟弟再来更新。

猜你喜欢

转载自blog.csdn.net/qq_42452134/article/details/82432032