利用python进行数据分析——NumPy学习笔记(2)

五、通用函数(ufunc):快速的元素集数组函数

通用函数(ufunc)是一种对ndarray中的数据执行元素级运算的函数。

一元ufunc:sqrt、exp、abs、square(各元素平方)

二元(接受两个数组),并返回一个结果数组。

[python]  view plain  copy
  1. arr=np.array([1,4,9]) #一元  
  2. np.sqrt(arr)  
  3. array([1.2.3.])  
  4.   
  5. np.exp(arr)  
  6. array([2.71828183e+005.45981500e+018.10308393e+03])  
  7.   
  8. np.abs(arr)  
  9. array([149])  
[python]  view plain  copy
  1. a=np.array([1,2,3]) #二元  
  2. b=np.array([3,4,5])  
  3. np.add(a,b)  
  4. array([468])  
  5.   
  6. np.power(a,b)  
  7. array([  1,  16243], dtype=int32)  
  8.   
  9. np.maximum(a,b) #元素级的最大值计算  
  10. array([345])  
  11.   
  12. np.minimum(a,b) #元素级的最小值计算  
  13. array([123])  

六、数学和统计方法

可以通过数组上的一组数学函数对整个数组或某个轴向的数据进行统计计算。sum、mean以及标准差str即可当做数组的实例方法调用,也可以当做顶级NumPy函数使用.

[python]  view plain  copy
  1. arr=np.array([[1,2,3,4],[1,2,3,4],[1,2,3,4]])  
  2. arr.mean()  
  3. 2.5  
  4.   
  5. np.mean(arr)  
  6. 2.5  
  7.   
  8. arr.sum()  
  9. 30  
  10.   
  11. arr.mean(axis=1#按行求均值  
  12. array([2.52.52.5])  
  13.   
  14. arr.mean(axis=0#按列求均值  
  15. array([1.2.3.4.])  
  16.   
  17. arr.argmax(axis=1)#每行最大元素的索引  
  18. array([333], dtype=int64)  
  19.   
  20. arr.max(axis=0#每列最大的元素  
  21. array([1234])  
  22.   
  23. arr.cumsum(0#所有元素按列累计和  
  24. array([[ 1,  2,  3,  4],  
  25.        [ 2,  4,  6,  8],  
  26.        [ 3,  6,  912]], dtype=int32)  
  27.   
  28. arr.cumprod(1#所有元素按行累计积  
  29. array([[ 1,  2,  624],  
  30.        [ 1,  2,  624],  
  31.        [ 1,  2,  624]], dtype=int32)  

七、排序

NumPy数组通过sort方法进行排序:

[python]  view plain  copy
  1. arr=np.random.randn(8)  
  2. arr  
  3. array([ 0.04586651,  0.0771802 , -0.19443214, -0.33640829, -2.17824081,  
  4.        -0.62737089,  1.98394763,  0.224598  ])  
  5.   
  6. arr.sort() #从小到大排序  
  7. arr  
  8. array([-2.17824081, -0.62737089, -0.33640829, -0.19443214,  0.04586651,  
  9.         0.0771802 ,  0.224598  ,  1.98394763])  

对于多维数组可以在任意一个轴上进行排序,只需将轴编号传给sort即可:

[python]  view plain  copy
  1. arr=np.random.randn(5,3)  
  2. arr  
  3. array([[-0.53160249, -0.10427409,  0.87371696],  
  4.        [ 1.81120345,  0.42954901,  0.8161918 ],  
  5.        [ 1.53920204,  0.18664226,  1.54184974],  
  6.        [ 0.82112747,  0.7449161 , -0.92298269],  
  7.        [-1.35032629,  1.29679028,  0.39718916]])  
  8.   
  9. arr.sort(1#按行进行排序  
  10. arr  
  11. array([[-0.53160249, -0.10427409,  0.87371696],  
  12.        [ 0.42954901,  0.8161918 ,  1.81120345],  
  13.        [ 0.18664226,  1.53920204,  1.54184974],  
  14.        [-0.92298269,  0.7449161 ,  0.82112747],  
  15.        [-1.35032629,  0.39718916,  1.29679028]])  

猜你喜欢

转载自blog.csdn.net/weixin_38300566/article/details/80620483