一.数据分析——表示 单元1:NumPy库入门

1. 数据的维度

  • 维度:一组数据的组织形式。

(数据维度就是在数据之间形成特定关系,表达多种数据含义的一个很重要的基础概念。)

  • 一维数据:由对等关系有序或无序数据构成,采用线性方式组织。对应列表、数组和集合等概念。

列表和数组是一组数据的有序结构,它们有所区别

列表:数据类型可以不同

数组:数据类型相同

  • 二维数据:由多个一维数据构成,是一维数据的组合形式。

表格是典型的二维数据,其中表头是二维数据的一部分

  • 多维数据:由一维或二维数据在新维度上扩展形成。
  • 高维数据:仅利用最基本的二元关系展示数据间的复杂结构。

       

  • 数据维度的Python表示

一维数据:列表(有序)和集合(无序)类型

二维数据:列表类型

多维数据:列表类型

高维数据:字典类型或数据表示格式


2. NumPy的数组对象:ndarray

NumPy是一个开源的Python科学计算基础库。

  • 一个强大的N维数组对象ndarray
  • 广播功能函数
  • 整合C/C++/Fortran代码的工具
  • 线性代数、傅里叶变换、随机数生成等功能

NumPy是SciPy、Pandas等数据处理或科学计算库的基础。

NumPy的应用:import numpy as np   尽管别名可以省略或更改,建议使用上述约定的别名。

在Python语言中,已经有了列表类型,为啥还需要数组类型?

  • 数组对象可以去掉元素间运算所需的循环,使一维向量更像单个数据。
  • 设置专门的数组对象,经过优化,可以提升这类应用的运算速度。

观察:科学计算中,一个维度所有数据的类型往往相同。

  • 数组对象采用相同的数据类型,有助于节省运算和存储空间。

ndarray是一个多维数组对象,由两部分构成:

  • 实际的数据
  • 描述这些数据的元数据(数据维度、数据类型等)

ndarray数组一般要求所有元素类型相同(同质),数组下标从0开始。

ndarray对象的属性
属性 说明

.ndim

秩,即轴的数量或维度的数量
.shape ndarray对象的尺度,对于矩阵,n行m列
.size ndarray对象元素的个数,相当于.shape中n*m的值
.dtype ndarray对象的元素类型
.itemsize ndarray对象中每个元素的大小,以字节为单位

ndarray为什么要支持这么多种元素类型?

 对比:Python语法仅支持整数、浮点数和复数3种类型

  • 科学计算涉及数据较多,对存储和性能都有较高要求
  • 对元素类型精细定义,有助于NumPy合理使用存储空间并优化性能。
  • 对元素类型精细定义,有助于程序员对程序规模有合理评估。


3. ndarray数组的创建和变换

ndarray数组的创建方法:

  • 从Python中的列表、元组等类型创建ndarray数组。
  • 使用NumPy中函数创建ndarray数组,如:arange, ones, zeros等。
  • 从字节流(raw bytes)中创建ndarray数组。
  • 从文件中读取特定格式,创建ndarray数组。

1)从Python中的列表、元组等类型创建ndarray数组

        x = np.array(list/tuple)

        x = np.array(list/tuple, dtype=np.float32)

        当np.array()不指定dtype时,NumPy将根据数据情况关联一个dtype类型。

                分别对应:

 2)使用NumPy中函数创建ndarray数组,如arange, ones, zeros等

函数 说明
np.arange(n) 类似range()函数,返回ndarray类型,元素从0到n-1
np.ones(shape) 根据shape生成一个全1数组,shape是元组类型
np.zeros(shape) 根据shape生成一个全0数组,shape是元组类型
np.full(shape,val) 根据shape生成一个数组,每个元素值都是val

np.eye(n)

创建一个正方的n*n单位矩阵,对角线为1,其余为0
np.ones_like(a) 根据数组a的形状生成一个全1的数组
np.zeros_like(a) 根据数组a的形状生成一个全0的数组
np.full_like(a,val) 根据数组a的形状生成一个数组,每个元素值都是val
np.linspace() 根据起止数据等间距地填充数据,形成数组
np.concatenate() 将两个或多个数组合并成一个新的数组

          

         

ndarray数组的变换:

对于创建后的ndarray数组,可以对其进行维度变换元素类型变换。   

  • 维度变换    
ndarray数组的维度变换
方法 说明
.reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变
.resize(shape) 与.reshape()功能一致,但修改原数组
.swapaxes(ax1,ax2) 将数组n个维度中两个维度进行调换
.flatten() 对数组进行降维,返回折叠后的一维数组,原数组不变

          

  •  类型变换

        new_a = a.astype(new_type)

           

         astype()方法一定会创建新的数组(原始数组的一个拷贝),即使两个类型一致。

        ndarray数组向列表的转换:ls = a.tolist()

        


 4. ndarray数组的操作

数组的索引和切片

索引:获取数组中特定位置元素的过程

切片:获取数组元素子集的过程

一维数组的索引和切片:与Python的列表类似

起始编号:终止编号(不含);步长

多维数组的索引

 多维数组的切片


 5. ndarray数组的运算

数组与标量之间的运算

数组与标量之间的运算作用于数组的每一个元素

  

NumPy一元函数
函数 说明
np.abs(x)        np.fabs(x) 计算数组各元素的绝对值
np.sqrt(x) 计算数组各元素的平方根
np.square(x) 计算数组各元素的平方
np.log(x)        np.log10(x)        np.log2(x) 计算数组各元素的自然对数、10底对数和2底对数
np.ceil(x)        np.floor(x) 计算数组各元素的ceiling值或floor值
np.rint(x) 计算数组各元素的四舍五入值
np.modf(x) 将数组各元素的小数和整数部分以两个独立数组形式返回

np.cos(x)        np.cosh(x)

np.sin(x)        np.sinh(x)

np.tan(x)        np.tanh(x)

计算数组各元素的普通型和双曲型三角函数
np.exp(x) 计算数组各元素的指数值
np.sign(x) 计算数组各元素的符号值,1(+), 0, -1(-)

           

NumPy二元函数
函数 说明
+         -         *         /         ** 两个数组各元素进行对应运算

np.maximum()        np.fmax()

np.minmum()        np.fmin()

元素级的最大值/最小值计算
np.mod(x,y) 元素级的模运算
np.copysign(x,y) 将数组y中各元素的符号赋值给数组x对应元素
>        <        >=        <=        ==        != 算术比较,产生布尔型数组

   

文章内容来自:中国大学慕课-嵩天老师

猜你喜欢

转载自blog.csdn.net/panlan7/article/details/124478851