Numpy(三): 数组操作

Numpy 中包含了一些函数用于处理数组,大致如下:

1、修改数组形状
reshape    不改变数据的条件下修改形状, numpy.reshape(arr, newshape, order='C')

  • arr:要修改形状的数组
  • newshape:整数或者整数数组,新的形状应当兼容原有形状
  • order:'C' -- 按行,'F' -- 按列,'A' -- 原顺序,'k' -- 元素在内存中的出现顺序、
>>> import numpy as np
>>> a = np.arange(8)
>>> print(a)
[0 1 2 3 4 5 6 7]
>>> a.reshape(2,4)
array([[0, 1, 2, 3],
       [4, 5, 6, 7]])
>>> a.reshape(4,2)
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7]])


flat    数组元素迭代器

>>> a = np.arange(9).reshape(3,3) 
>>> for row in a:
    print (row)

[0 1 2]
[3 4 5]
[6 7 8]
#对数组中每个元素都进行处理,可以使用flat属性,该属性是一个数组元素迭代器:
>>> for element in a.flat:
    print (element)
0
1
2
3
4
5
6
7
8


flatten    返回一份数组拷贝,对拷贝所做的修改不会影响原始数组

  • order:'C' -- 按行,'F' -- 按列,'A' -- 原顺序,'K' -- 元素在内存中的出现顺序。
>>> a = np.arange(8).reshape(2,4)
>>> print(a)
[[0 1 2 3]
 [4 5 6 7]]
# 默认按行
>>> print(a.flatten())
[0 1 2 3 4 5 6 7]
#以F风格
>>> print(a.flatten(order = 'F'))
[0 4 1 5 2 6 3 7]
#以C风格
>>> print(a.flatten(order = 'C'))
[0 1 2 3 4 5 6 7]

ravel    返回展开数组

numpy.ravel() 展平的数组元素,顺序通常是"C风格",返回的是数组视图(view,有点类似 C/C++引用reference的意味),修改会影响原始数组。

该函数接收两个参数:

numpy.ravel(a, order='C')
  • order:'C' -- 按行,'F' -- 按列,'A' -- 原顺序,'K' -- 元素在内存中的出现顺序。
>>> a = np.arange(8).reshape(2,4)
>>> a
array([[0, 1, 2, 3],
       [4, 5, 6, 7]])

# 默认按行
>>> print(a.ravel())
[0 1 2 3 4 5 6 7]

>>> print(a.ravel(order = 'F'))
[0 4 1 5 2 6 3 7]

2、翻转数组

transpose    对换数组的维度

numpy.transpose(arr, axes)
  • arr:要操作的数组
  • axes:整数列表,对应维度,通常所有维度都会对换
>>> a = np.arange(12).reshape(3,4)
>>> a
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

>>> print(np.transpose(a))
[[ 0  4  8]
 [ 1  5  9]
 [ 2  6 10]
 [ 3  7 11]]
>>> 

ndarray.T    和 self.transpose() 相同

>>> a = np.arange(12).reshape(3,4)
>>> a
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
>>> a.T
array([[ 0,  4,  8],
       [ 1,  5,  9],
       [ 2,  6, 10],
       [ 3,  7, 11]])


rollaxis    向后滚动指定的轴

numpy.rollaxis(arr, axis, start)

参数说明:

  • arr:数组
  • axis:要向后滚动的轴,其它轴的相对位置不会改变
  • start:默认为零,表示完整的滚动。会滚动到特定位置。
>>> a = np.arange(8).reshape(2,2,2)
>>> a
array([[[0, 1],
        [2, 3]],

       [[4, 5],
        [6, 7]]])
>>> print (a)
[[[0 1]
  [2 3]]

 [[4 5]
  [6 7]]]
>>> print(np.where(a==6))   
(array([1], dtype=int32), array([1], dtype=int32), array([0], dtype=int32))
>>> print(a[1,1,0])  # 为 6

6
>>> print(np.where(a==0))
(array([0], dtype=int32), array([0], dtype=int32), array([0], dtype=int32))
>>> print(np.where(a==1))
(array([0], dtype=int32), array([0], dtype=int32), array([1], dtype=int32))
>>> print(np.where(a==2))
(array([0], dtype=int32), array([1], dtype=int32), array([0], dtype=int32))
>>> print(np.where(a==3))
(array([0], dtype=int32), array([1], dtype=int32), array([1], dtype=int32))
>>> print(np.where(a==4))
(array([1], dtype=int32), array([0], dtype=int32), array([0], dtype=int32))
>>> print(np.where(a==5))
(array([1], dtype=int32), array([0], dtype=int32), array([1], dtype=int32))
>>> print(np.where(a==6))
(array([1], dtype=int32), array([1], dtype=int32), array([0], dtype=int32))
>>> print(np.where(a==7))
(array([1], dtype=int32), array([1], dtype=int32), array([1], dtype=int32))

# 将轴 2 滚动到轴 0(宽度到深度)
>>> b = np.rollaxis(a,2,0)
>>> print (b)
[[[0 2]
  [4 6]]

 [[1 3]
  [5 7]]]
>>> print(np.where(b==6))   
(array([0], dtype=int32), array([1], dtype=int32), array([1], dtype=int32))

# 将轴 2 滚动到轴 1:(宽度到高度)
>>> c = np.rollaxis(a,2,1)
>>> print (c)
[[[0 2]
  [1 3]]

 [[4 6]
  [5 7]]]

# 查看元素 a[1,1,0],即 6 的坐标,变成 [1, 0, 1]
# 最后的 0 和 它前面的 1 对换位置
>>> print(np.where(c==6))   
(array([1], dtype=int32), array([0], dtype=int32), array([1], dtype=int32))

swapaxes    对换数组的两个轴

numpy.swapaxes(arr, axis1, axis2)
  • arr:输入的数组
  • axis1:对应第一个轴的整数
  • axis2:对应第二个轴的整数
>>> a = np.arange(8).reshape(2,2,2)
>>> print (a)
[[[0 1]
  [2 3]]

 [[4 5]
  [6 7]]]

# 现在交换轴 0(深度方向)到轴 2(宽度方向)
>>> print (np.swapaxes(a, 2, 0))
[[[0 4]
  [2 6]]

 [[1 5]
  [3 7]]]

3、修改数组维度

broadcast    产生模仿广播的对象,它返回一个对象,该对象封装了将一个数组广播到另一个数组的结果。

该函数使用两个数组作为输入参数,如下实例:

>>> x = np.array([[1], [2], [3]])
>>> y=np.array([4,5,6])
>>> b = np.broadcast(x,y)  
>>> r,c = b.iters
>>> print (next(r), next(c))
1 4
>>> print (next(r), next(c))
1 5
>>> print (next(r), next(c))
1 6
>>> print (next(r), next(c))
2 4
>>> print (next(r), next(c))
2 5
>>> print (next(r), next(c))
2 6
>>> print (next(r), next(c))
3 4
>>> print (next(r), next(c))
3 5
>>> print (next(r), next(c))
3 6
>>> print (b.shape)
(3, 3)
>>> b = np.broadcast(x,y)
>>> c = np.empty(b.shape)
>>> print (c.shape)
(3, 3)
>>> c.flat = [u + v for (u,v) in b]
>>> print (c)
[[5. 6. 7.]
 [6. 7. 8.]
 [7. 8. 9.]]
>>> print (x + y)

[[5 6 7]
 [6 7 8]
 [7 8 9]]


broadcast_to     函数将数组广播到新形状。它在原始数组上返回只读视图。 它通常不连续。 如果新形状不符合 NumPy 的广播规则,该函数可能会抛出ValueError。

numpy.broadcast_to(array, shape, subok)
>>> import numpy as np
>>> a = np.arange(4).reshape(1,4)
>>> a
array([[0, 1, 2, 3]])
>>> print (np.broadcast_to(a,(4,4)))
[[0 1 2 3]
 [0 1 2 3]
 [0 1 2 3]
 [0 1 2 3]]

expand_dims    函数通过在指定位置插入新的轴来扩展数组形状,函数格式如下:

 numpy.expand_dims(arr, axis)

参数说明:

  • arr:输入数组
  • axis:新轴插入的位置
>>> x = np.array(([1,2],[3,4]))
>>> x
array([[1, 2],
       [3, 4]])
>>> y = np.expand_dims(x, axis = 0)
>>> y
array([[[1, 2],
        [3, 4]]])
>>> print (x.shape, y.shape)
(2, 2) (1, 2, 2)
>>> y = np.expand_dims(x, axis = 1)
>>> print (y)
[[[1 2]]

 [[3 4]]]
>>> print (x.ndim,y.ndim)
2 3
>>> print (x.shape, y.shape)
(2, 2) (2, 1, 2)

squeeze    从数组的形状中删除一维条目

numpy.squeeze(arr, axis)
  • arr:输入数组
  • axis:整数或整数元组,用于选择形状中一维条目的子集
>>> x = np.arange(9).reshape(1,3,3)
>>> x
array([[[0, 1, 2],
        [3, 4, 5],
        [6, 7, 8]]])
>>> y = np.squeeze(x)
>>> y
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
>>> print (x.shape, y.shape)
(1, 3, 3) (3, 3)

4、连接数组

concatenate    连接沿现有轴的数组序列
numpy.concatenate((a1, a2, ...), axis)

  • a1, a2, ...:相同类型的数组
  • axis:沿着它连接数组的轴,默认为 0
>>> a = np.array([[1,2],[3,4]])
>>> a
array([[1, 2],
       [3, 4]])
>>> b = np.array([[5,6],[7,8]])
>>> print (np.concatenate((a,b)))
[[1 2]
 [3 4]
 [5 6]
 [7 8]]
>>> print (np.concatenate((a,b),axis = 1))
[[1 2 5 6]
 [3 4 7 8]]

stack    沿着新的轴加入一系列数组。

numpy.stack(arrays, axis)
  • arrays相同形状的数组序列
  • axis:返回数组中的轴,输入数组沿着它来堆叠
>>> import numpy as np
>>> a = np.array([[1,2],[3,4]])
>>> print (a)
[[1 2]
 [3 4]]
>>> b = np.array([[5,6],[7,8]])
>>> b
array([[5, 6],
       [7, 8]])
>>> print (np.stack((a,b),0))
[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]
>>> print (np.stack((a,b),1))
[[[1 2]
  [5 6]]

 [[3 4]
  [7 8]]]

hstack    水平堆叠序列中的数组(列方向)

>>> a = np.array([[1,2],[3,4]])
>>> b = np.array([[5,6],[7,8]])
>>> c = np.hstack((a,b))
>>> a
array([[1, 2],
       [3, 4]])
>>> b
array([[5, 6],
       [7, 8]])
>>> c
array([[1, 2, 5, 6],
       [3, 4, 7, 8]])


vstack    竖直堆叠序列中的数组(行方向)

numpy.vstack 是 numpy.stack 函数的变体,它通过垂直堆叠来生成数组。

>>> a = np.array([[1,2],[3,4]])
>>> print (a)
[[1 2]
 [3 4]]
>>> b = np.array([[5,6],[7,8]])
>>> print (b)
[[5 6]
 [7 8]]
>>> c = np.vstack((a,b))
>>> print (c)
[[1 2]
 [3 4]
 [5 6]
 [7 8]]


5、分割数组

split    将一个数组分割为多个子数组

numpy.split(ary, indices_or_sections, axis)
  • ary:被分割的数组
  • indices_or_sections:果是一个整数,就用该数平均切分,如果是一个数组,为沿轴切分的位置(左开右闭)
  • axis:沿着哪个维度进行切向,默认为0,横向切分。为1时,纵向切分
>>> a = np.arange(9)
>>> print (a)
[0 1 2 3 4 5 6 7 8]
>>> b = np.split(a,3)
>>> print (b)
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8])]
>>> b = np.split(a,[4,7])
>>> print (b)
[array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8])]
>>> b[0]
array([0, 1, 2, 3])


hsplit    将一个数组水平分割为多个子数组(按列)

>>> harr = np.floor(10 * np.random.random((2, 6)))
>>> print(harr)
[[5. 4. 5. 2. 6. 8.]
 [4. 0. 9. 0. 0. 6.]]
>>> print(np.hsplit(harr, 3))
[array([[5., 4.],
       [4., 0.]]), array([[5., 2.],
       [9., 0.]]), array([[6., 8.],
       [0., 6.]])]


vsplit    将一个数组垂直分割为多个子数组(按行)

>>> a = np.arange(16).reshape(4,4)
>>> print (a)
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]]
>>> b = np.vsplit(a,2)
>>> print (b)
[array([[0, 1, 2, 3],
       [4, 5, 6, 7]]), array([[ 8,  9, 10, 11],
       [12, 13, 14, 15]])]


6、数组元素的添加与删除

resize    返回指定形状的新数组

如果新数组大小大于原始大小,则包含原始数组中的元素的副本。

>>> a = np.array([[1,2,3],[4,5,6]])
>>> print (a)
[[1 2 3]
 [4 5 6]]
>>> print (a.shape)
(2, 3)
>>> b = np.resize(a, (3,2))
>>> 
>>> print (b)
[[1 2]
 [3 4]
 [5 6]]
>>> print (b.shape)
(3, 2)

#尺寸变大,第一行重复
>>> b = np.resize(a,(3,3))
>>> print (b)
[[1 2 3]
 [4 5 6]
 [1 2 3]]
>>> 


append    将值添加到数组末尾

numpy.append 函数在数组的末尾添加值。 追加操作会分配整个数组,并把原来的数组复制到新数组中。 此外,输入数组的维度必须匹配否则将生成ValueError。

append 函数返回的始终是一个一维数组。

numpy.append(arr, values, axis=None)

参数说明:

  • arr:输入数组
  • values:要向arr添加的值,需要和arr形状相同(除了要添加的轴)
  • axis:默认为 None。当axis无定义时,是横向加成,返回总是为一维数组!当axis有定义的时候,分别为0和1的时候。当axis有定义的时候,分别为0和1的时候(列数要相同)。当axis为1时,数组是加在右边(行数要相同)
>>> a = np.array([[1,2,3],[4,5,6]])
>>> print (a)
[[1 2 3]
 [4 5 6]]
>>> print (np.append(a, [7,8,9]))
[1 2 3 4 5 6 7 8 9]
>>> print (np.append(a, [[7,8,9]],axis = 0))
[[1 2 3]
 [4 5 6]
 [7 8 9]]
>>> print (np.append(a, [[5,5,5],[7,8,9]],axis = 1))
[[1 2 3 5 5 5]
 [4 5 6 7 8 9]]

insert     函数在给定索引之前,沿给定轴在输入数组中插入值。

如果值的类型转换为要插入,则它与输入数组不同。 插入没有原地的,函数会返回一个新数组。 此外,如果未提供轴,则输入数组会被展开。

numpy.insert(arr, obj, values, axis)

参数说明:

  • arr:输入数组
  • obj:在其之前插入值的索引
  • values:要插入的值
  • axis:沿着它插入的轴,如果未提供,则输入数组会被展开
>>> a = np.array([[1,2],[3,4],[5,6]])
>>> print (a)
[[1 2]
 [3 4]
 [5 6]]

#print ('未传递 Axis 参数。 在插入之前输入数组会被展开。')
>>> print (np.insert(a,3,[11,12]))
[ 1  2  3 11 12  4  5  6]
>>> print (np.insert(a,1,[11],axis = 0))
[[ 1  2]
 [11 11]
 [ 3  4]
 [ 5  6]]
>>> print (np.insert(a,1,11,axis = 1))
[[ 1 11  2]
 [ 3 11  4]
 [ 5 11  6]]

delete     函数返回从输入数组中删除指定子数组的新数组。 与 insert() 函数的情况一样,如果未提供轴参数,则输入数组将展开。

Numpy.delete(arr, obj, axis)

参数说明:

  • arr:输入数组
  • obj:可以被切片,整数或者整数数组,表明要从输入数组删除的子数组
  • axis:沿着它删除给定子数组的轴,如果未提供,则输入数组会被展开
>>> a = np.arange(12).reshape(3,4)
>>> print (a)
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
>>> print (np.delete(a,5))
[ 0  1  2  3  4  6  7  8  9 10 11]
>>> print (np.delete(a,1,axis = 1))
[[ 0  2  3]
 [ 4  6  7]
 [ 8 10 11]]
>>> a = np.array([1,2,3,4,5,6,7,8,9,10])
>>> print (np.delete(a, np.s_[::2]))
[ 2  4  6  8 10]

unique     函数用于去除数组中的重复元素。

numpy.unique(arr, return_index, return_inverse, return_counts)
  • arr:输入数组,如果不是一维数组则会展开
  • return_index:如果为true,返回新列表元素在旧列表中的位置(下标),并以列表形式储
  • return_inverse:如果为true,返回旧列表元素在新列表中的位置(下标),并以列表形式储
  • return_counts:如果为true,返回去重数组中的元素在原数组中的出现次数
>>> a = np.array([5,2,6,2,7,5,6,8,2,9])
>>> print (a)
[5 2 6 2 7 5 6 8 2 9]
>>> u = np.unique(a)
>>> print (u)
[2 5 6 7 8 9]
>>> u,indices = np.unique(a, return_index = True)
>>> print (indices)
[1 0 2 4 7 9]

>>> print (a)
[5 2 6 2 7 5 6 8 2 9]
>>> u,indices = np.unique(a,return_inverse = True)
>>> print (u)
[2 5 6 7 8 9]
>>> print (indices)
[1 0 2 0 3 1 2 4 0 5]

#使用下标重构原数组
>>> print (u[indices])
[5 2 6 2 7 5 6 8 2 9]

#返回去重元素的重复数量
>>> u,indices = np.unique(a,return_counts = True)
>>> print (u)
[2 5 6 7 8 9]
>>> print (indices)
[3 2 2 1 1 1]

猜你喜欢

转载自blog.csdn.net/zcb_data/article/details/109997989