python之numpy包知识要点总结

一、简介

  numpy主要是用来存储和处理大型矩阵,提供了一种存储单一数据类型的多维数组对象------ndarray。还提供了多种运算函数,能够完成数据计算和统计分析,是数据分析的重要工具包。

二、数组对象(ndarray)

  1、创建数组对象

    (1)、创建自定义数组

        1、numpy.array(object,dtype=None,copy=True,order='K',subok=False,ndmin=0)

            object:就是要创建的数组

            dtype:表示数组所需的数据类型,默认是None,即保存对象所需的最小类型

            ndmin:指定生成数组应该具有的最小维数,默认为None。

            

        2、通过arange函数创建一维数组:arange(start, end, sep)

          

        3、创建一维等差数组:linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

          

        4、创建等比数列:logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)

          

        5、创建全零数组:zeros(shape, dtype=None, order='C')

          

        6、创建全为1的数组:ones(shape, dtype=None, order='C')

          

        7、创建对角线全为1的多维数组:eye(N, M=None, k=0, dtype=float)

          

        8、创建自定义对角线数值的数组:diag(v, k=0)

          

    (2)、创建随机数组,利用numpy包里的random模块

        1、创建0-1的随机浮点数一维数组:random.random(num)

          

        2、创建指定范围的随机整数多维数组:randint(low, high=None, size=None, dtype='l')

          

        3、创建服从均匀分布的随机数组,范围[0, 1):rand(*dn)

          

        4、创建服从正态分布的随机数组:randn(*dn)

          

  2、数组对象属性

    ---------数组属性:

            ndim:表示数组维数,返回int类型

            shape:表示数组的形状大小,对于n行m列的矩阵,形状为(n,m),返回tuple类型

            size:表示数组的元素总个数,等于数组形状的乘积,返回int类型

            dtype:描述数组中的元素的类型,返回data-type

            itemsize:表示数组的每个元素的大小(以字节为单位),返回int类型

    -----------访问属性:

            

  3、改变数组形状

    (1)、使用shape改变形状

        

    (2)、使用reshape改变形状

        

    (3)、展平数组:

        ----使用ravel函数

        

        ----使用flatten函数

        

    (4)、组合数组:

        -----使用hstack/vstack函数

        

        -----使用concatenate函数

        

    (5)、分割数组:

        -----使用hsplit/vsplit函授

        

        -----使用split函数

        

  4、访问数组

    (1)、一维数组的访问

        

    (2)、二维数组的访问

        

三、数据类型

  numpy的数据类型比python内置的数据类型多,常用的数据类型如下所示:(引用菜鸟教程:http://www.runoob.com/numpy/numpy-dtype.html)

  

四:numpy的矩阵对象

  1、创建矩阵

    

  2、矩阵属性

      T:返回自身的转置

      H:返回自身的共轭转置

      I:返回自身的逆矩阵

      A:返回自身数据的二维数组的一个视图

      

  3、矩阵运算

    (1)、四则运算

        

        

        

        

    (2)、比较运算

        比较运算符:>、<、==、>=、<=、!=

        返回结果:一个布尔数组,也就是每个元素的比较结果

        

        

    (3)、逻辑运算

        逻辑运算符:逻辑或-----any,逻辑与------all

        返回结果:一个布尔值True或False

        

五、ufunc函数(universal function)

  1、概念:

      全程通用函数(universal function),是一种能够对数组中所有元素进行操作的函数,结果是以数组形式输出,因此不需要对数组每个元素都进行操作,所以比math库中的函数操作效率高。

  2、广播机制

      广播(broadcasing)是指不同形状的数组之间进行算数运算的一种方式。

  3、广播机制----->四原则

      参与运算的数组其中一个的维度为1且列相等

      参与运算的数组的维度相等,则其中一个的列为1且行相等

      参与运算的数组都向其中形状最大的看齐,即根据shape属性最大的运算,形状不足的就加按照行或列补齐,也就是行复制或者列复制

      输出的数组跟最大的数组形状相同

      

六、利用numpy统计分析

  1、文件的读写

    (1)、以二进制形式写入/读取文件

        -----写入文件:save(file, arr, allow_pickle=True, fix_imports=True)/savez(file, arr, allow_pickle=True, fix_imports=True)

        

        -----读取文件:load(file, mmap_mode=None, allow_pickle=True, fix_imports=True,encoding='ASCII')

        

        

    (2)、以文本形式写入/读取文件(txt,csv格式)

        -----写入文件:loadtxt(fname, dtype=float, comments='#', delimiter=None,converters=None, skiprows=0, usecols=None, unpack=False,ndmin=0)

        

        -----读取文件:loadtxt(fname, dtype=float, comments='#', delimiter=None,converters=None, skiprows=0, usecols=None, unpack=False,ndmin=0)

          

  2、数组排序

    (1)、直接排序

        方法:sort(a, axis=-1, kind='quicksort', order=None)

        参数:axis=1 为沿横轴排序; axis=0 为沿纵轴排序,默认沿横轴排序

        

    (2)、间接排序

        方法:argsort(a, axis=-1, kind='quicksort', order=None)返回的是下标

         参数:axis=0 为沿横轴排序; axis=0 为沿纵轴排序,默认沿横轴排序

        

  3、数据去重

    方法:unique(ar, return_index=False, return_inverse=False,return_counts=False, axis=None)

     

  4、重复数据,可以理解为数据的复制

    (1)、重复整个数组

        方法:tile(A, reps)

         参数:A表示数组,reps表示重复的个数

    (2)、重复数组中的元素

        方法:repeat(a, repeats, axis=None)

        参数:a 表示传入的数组,repeats表示要重复的次数,axis=1表示沿横轴重复,axis=0表示沿纵轴重复

        

  5、常用统计函数

    参数:axis=0 表示纵向计算

       axis=1 表示横向计算

       默认不写 表示计算整个数组

    (1)、求和:sum

        

    (2)、求平均值:mean

        

    (3)、求最大值:max

        

    (4)、求最小值:min

        

    (5)、求最大元素的索引:argmax

        

    (6)、求最小元素的索引:argmin

        

    (7)、求方差:var

        

    (8)、求标准差:std

        

    (9)、求所有元素的累计和:cumsum

        

    (10)、求所有元素的累计积:cumprod

        

猜你喜欢

转载自www.cnblogs.com/thoughtful-actors/p/10080530.html
今日推荐