NumPy学习笔记11.数组操作

NumPy 数组操作

NumPy中包含了一些函数用于处理数组，大概可分为以下几类：

修改数组形状
翻转数组
修改数组维度
连接数组
分割数组
数组元素的添加与删除

修改数组形状

函数	描述
reshape	不改变数据的条件下修改形状
flat	数组元素迭代器
flatten	返回一份数组拷贝，对拷贝所做的修改不会影响原始数组
ravel	返回展开数组

numpy.reshape函数：

numpy.reshape(arr,newshape,order = 'C')

arr:要修改形状的数组
newshape:整数或者整数数组，新的形状应当兼容原有形状
order:‘C’–按行，‘F’–按列，‘A’–原顺序，‘k’–元素在内存中的出现顺序。

import numpy as np

a = np.arange(8)
print(a)
print('\n')

b = a.reshape(4,2)
print('修改后的数组：')
print(b)

[0 1 2 3 4 5 6 7]


修改后的数组：
[[0 1]
 [2 3]
 [4 5]
 [6 7]]

numpy.ndarray.flat实例：

import numpy as np

a = np.arange(9).reshape(3,3)
print('原始数组：')
for row in a:
    print(row)
    
# 对数组中每个元素都进行处理，可以使用flat属性，该属性是一个数组元素迭代器：
print('迭代后的数组：')
for element in a.flat:
    print(element)

原始数组：
[0 1 2]
[3 4 5]
[6 7 8]
迭代后的数组：
0
1
2
3
4
5
6
7
8

numpy.ndarray.flatten函数：

ndarray.flatten(order = 'C')

import numpy as np

a = np.arange(8).reshape(2,4)

print('原数组：')
print(a)
print('\n')

print('展开的数组：')
print(a.flatten())
print('\n')

print('以F风格顺序展开的数组：')
print(a.flatten(order = 'F'))

原数组：
[[0 1 2 3]
 [4 5 6 7]]


展开的数组：
[0 1 2 3 4 5 6 7]


以F风格顺序展开的数组：
[0 4 1 5 2 6 3 7]

numpy.ravel()展平的数组元素，顺序通常是“C风格”，返回的是数组视图，修改会影响原始数组。

numpy.ravel(a, order = 'C')
# order：'C'--按行，'F'--按列，'A'--原顺序，'K'--元素在内存中的出现顺序

import numpy as np

a = np.arange(8).reshape(2,4)

print('原数组：')
print(a)
print('\n')

print('调用ravel函数之后：')
print(a.ravel())
print('\n')

print('以F风格顺序调用ravel函数之后：')
print(a.ravel(order = 'F'))

原数组：
[[0 1 2 3]
 [4 5 6 7]]


调用ravel函数之后：
[0 1 2 3 4 5 6 7]


以F风格顺序调用ravel函数之后：
[0 4 1 5 2 6 3 7]

翻转数组

函数	描述
transpose	对换数组的维度
ndarray.T	和self.transpose()相同
rollaxis	向后滚动指定的轴
swapaxes	对换数组的两个轴

numpy.transpose函数格式如下：

numpy.transpose(arr, axes)
# arr:要操作的数组
# axes:整数列表，对应维度，通常所有维度都会对换

import numpy as np

a = np.arange(12).reshape(3,4)

print('原数组：')
print(a)
print('\n')

print('对换数组：')
print(np.transpose(a))

原数组：
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]


对换数组：
[[ 0  4  8]
 [ 1  5  9]
 [ 2  6 10]
 [ 3  7 11]]

numpy.ndarray.T类似numpy.transpose:

import numpy as np

a = np.arange(12).reshape(3,4)

print('原数组：')
print(a)
print('\n')

print('转置数组：')
print(a.T)

原数组：
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]


转置数组：
[[ 0  4  8]
 [ 1  5  9]
 [ 2  6 10]
 [ 3  7 11]]

numpy.rollaxis函数格式：

numpy.rollaxis(arr, axis, start)
# arr:数组
# axis:要向后滚动的轴，其它轴的相对位置不会改变
# start:默认为零，表示完整的滚动。会滚动到特定位置

import numpy as np

# 创建了三维的 ndarray
a = np.arange(8).reshape(2,2,2)
 
print ('原数组：')
print (a)
print ('\n')
# 将轴 2 滚动到轴 0（宽度到深度）
 
print ('调用 rollaxis 函数：')
print (np.rollaxis(a,2))
# 将轴 0 滚动到轴 1：（宽度到高度）
print ('\n')
 
print ('调用 rollaxis 函数：')
print (np.rollaxis(a,2,1))

原数组：
[[[0 1]
  [2 3]]

 [[4 5]
  [6 7]]]


调用 rollaxis 函数：
[[[0 2]
  [4 6]]

 [[1 3]
  [5 7]]]


调用 rollaxis 函数：
[[[0 2]
  [1 3]]

 [[4 6]
  [5 7]]]

numpy.swapaxes函数格式：

numpy.swapaxes(arr, axis1, axis2)
# arr:输入的数组
# axis1:对应第一个轴的整数
# axis2:对应第二个轴的整数

import numpy as np
 
# 创建了三维的 ndarray
a = np.arange(8).reshape(2,2,2)
 
print ('原数组：')
print (a)
print ('\n')
# 现在交换轴 0（深度方向）到轴 2（宽度方向）
 
print ('调用 swapaxes 函数后的数组：')
print (np.swapaxes(a, 2, 0))

原数组：
[[[0 1]
  [2 3]]

 [[4 5]
  [6 7]]]


调用 swapaxes 函数后的数组：
[[[0 4]
  [2 6]]

 [[1 5]
  [3 7]]]

修改数组维度

维度	描述
broadcast	产生模仿广播的对象
broadcast_to	将数组广播到新形状
expand_dims	扩展数组的形状
squeeze	从数组的形状中删除一维条目

numpy.broadcast用于模仿广播的对象，它返回一个对象，该对象封装了将一个数组广播到另一个数组的结果。

import numpy as np

x = np.array([[1],[2],[3]])
y = np.array([4,5,6])

# 对y广播x
b = np.broadcast(x,y)
# 它拥有iterator 属性，基于自身组件的迭代器元组

print('对y广播x:')
r,c = b.iters

# Python3.x为next(context),Python2.x为context.next()
print(next(r),next(c))
print(next(r),next(c))
print('\n')
# shape 属性返回广播对象的形状

print('广播对象的形状：')
print(b.shape)
print('\n')
# 手动使用broadcast将x与y相加
b = np.broadcast(x,y)
c = np.empty(b.shape)

print('手动使用broadcast将x与y相加：')
print(c.shape)
print('\n')
c.flat = [u + v for (u,v) in b]

print('调用flat函数：')
print(c)
print('\n')
# 获得了和numpy内建的广播支持相同的结果

print('x与y的和：')
print(x + y)

对y广播x:
1 4
1 5


广播对象的形状：
(3, 3)


手动使用broadcast将x与y相加：
(3, 3)


调用flat函数：
[[5. 6. 7.]
 [6. 7. 8.]
 [7. 8. 9.]]


x与y的和：
[[5 6 7]
 [6 7 8]
 [7 8 9]]

numpy.broadcast_to 函数将数组广播到新形状。它在原始数组上返回只读视图。它通常不连续。如果新形状不符合 NumPy 的广播规则，该函数可能会抛出ValueError。

扫描二维码关注公众号，回复： 10816524 查看本文章

numpy.broadcast_to(array, shape, subok)

import numpy as np

a = np.arange(4).reshape(1,4)

print('原数组：')
print(a)
print('\n')

print('调用broadcast_to函数之后：')
print(np.broadcast_to(a,(4,4)))

原数组：
[[0 1 2 3]]


调用broadcast_to函数之后：
[[0 1 2 3]
 [0 1 2 3]
 [0 1 2 3]
 [0 1 2 3]]

numpy.expand_dims 函数通过在指定位置插入新的轴来扩展数组形状:

numpy.expand_dims(arr, axis)
# arr:输入数组
# axis:新轴插入的位置

import numpy as np

x = np.array(([1,2],[3,4]))

print('数组x:')
print(x)
print('\n')
y = np.expand_dims(x, axis = 0)

print('数组y:')
print(y)
print('\n')

print('数组x和y的形状：')
print(x.shape, y.shape)
print('\n')
# 在位置1插入轴
y = np.expand_dims(x, axis = 1)

print('在位置1插入轴之后的数组y:')
print(y)
print('\n')

print('x,ndim和y.ndim:')
print(x.ndim, y.ndim)
print('\n')

print('x.shape和y.shape:')
print(x.shape, y.shape)

数组x:
[[1 2]
 [3 4]]


数组y:
[[[1 2]
  [3 4]]]


数组x和y的形状：
(2, 2) (1, 2, 2)


在位置1插入轴之后的数组y:
[[[1 2]]

 [[3 4]]]


x,ndim和y.ndim:
2 3


x.shape和y.shape:
(2, 2) (2, 1, 2)

numpy.squeeze 函数从给定数组的形状中删除一维的条目：

numpy.squeeze(arr, axis)
# arr:输入数组
# axis:整数或整数元组，用于选择形状中一维条目的子集

import numpy as np

x = np.arange(9).reshape(1,3,3)

print('数组x:')
print(x)
print('\n')
y = np.squeeze(x)

print('数组y:')
print(y)
print('\n')

print('数组x和y的形状：')
print(x.shape, y.shape)

数组x:
[[[0 1 2]
  [3 4 5]
  [6 7 8]]]


数组y:
[[0 1 2]
 [3 4 5]
 [6 7 8]]


数组x和y的形状：
(1, 3, 3) (3, 3)

连接数组

函数	描述
concatenate	连接沿现有轴的数组序列
stack	沿着新的轴加入一系列数组
hstack	水平堆叠序列中的数组（列方向）
vstack	竖直堆叠序列中的数组（行方向）

numpy.concatenate 函数用于沿指定轴连接相同形状的两个或多个数组：

numpy.concatenate((a1, a2, ...), axis)
# a1, a2, ...:相同类型的数组
# axis:沿着它连接数组的轴，默认为0

import numpy as np

a = np.array([[1,2],[3,4]])

print('第一个数组：')
print(a)
print('\n')
b = np.array([[5,6],[7,8]])

print('第二个数组：')
print(b)
print('\n')
# 两个数组的维度相同

print('沿轴0连接两个数组；')
print(np.concatenate((a,b)))
print('\n')

print('沿轴1连接两个数组：')
print(np.concatenate((a,b), axis = 1))

第一个数组：
[[1 2]
 [3 4]]


第二个数组：
[[5 6]
 [7 8]]


沿轴0连接两个数组；
[[1 2]
 [3 4]
 [5 6]
 [7 8]]


沿轴1连接两个数组：
[[1 2 5 6]
 [3 4 7 8]]

numpy.stack 函数用于沿新轴连接数组序列

numpy.stack(arrays, axis)
# arrays相同形状的数组序列
# axis:返回数组中的轴，输入数组沿着它来堆叠

import numpy as np

a = np.array([[1,2],[3,4]])

print('第一个数组：')
print(a)
print('\n')
b = np.array([[5,6],[7,8]])

print('第二个数组：')
print(b)
print('\n')

print('沿轴0堆叠两个数组：')
print(np.stack((a,b), 0))
print('\n')

print('沿轴1堆叠两个数组：')
print(np.stack((a,b), 1))

第一个数组：
[[1 2]
 [3 4]]


第二个数组：
[[5 6]
 [7 8]]


沿轴0堆叠两个数组：
[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]


沿轴1堆叠两个数组：
[[[1 2]
  [5 6]]

 [[3 4]
  [7 8]]]

numpy.hstack 是 numpy.stack 函数的变体，它通过水平堆叠来生成数组。

import numpy as np

a = np.array([[1,2],[3,4]])

print('第一个数组：')
print(a)
print('\n')
b = np.array([[5,6],[7,8]])

print('第二个数组：')
print(b)
print('\n')

print('水平堆叠：')
c = np.hstack((a,b))
print(c)
print('\n')

第一个数组：
[[1 2]
 [3 4]]


第二个数组：
[[5 6]
 [7 8]]


水平堆叠：
[[1 2 5 6]
 [3 4 7 8]]

numpy.vstack 也是 numpy.stack 函数的变体，它通过垂直堆叠来生成数组。

import numpy as np

a = np.array([[1,2],[3,4]])

print('第一个数组：')
print(a)
print('\n')
b = np.array([[5,6],[7,8]])

print('第二个数组：')
print(b)
print('\n')

print('竖直堆叠：')
c = np.vstack((a,b))
print(c)
print('\n')

第一个数组：
[[1 2]
 [3 4]]


第二个数组：
[[5 6]
 [7 8]]


竖直堆叠：
[[1 2]
 [3 4]
 [5 6]
 [7 8]]

分割数组

函数	数组及操作
split	将一个数组分割为多个子数组
hsplit	将一个数组水平分割为多个子数组（按列）
vsplit	将一个数组垂直分割为多个子数组（按行）

numpy.split 函数沿特定的轴将数组分割为子数组:

numpy.split(ary, indices_or_sections, axis)
# ary：被分割的数组
# indices_or_sections：果是一个整数，就用该数平均切分，如果是一个数组，为沿轴切分的位置（左开右闭）
# axis：沿着哪个维度进行切向，默认为0，横向切分。为1时，纵向切分

import numpy as np

a = np.arange(9)

print('第一个数组：')
print(a)
print('\n')

print('将数组分为三个大小相等的子数组：')
b = np.split(a, 3)
print(b)
print('\n')

print('将数组在一维数组中表明的位置分割：')
b = np.split(a, [4,7])
print(b)

第一个数组：
[0 1 2 3 4 5 6 7 8]


将数组分为三个大小相等的子数组：
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8])]


将数组在一维数组中表明的位置分割：
[array([0, 1, 2, 3]), array([4, 5, 6]), array([7, 8])]

numpy.hsplit 函数用于水平分割数组，通过指定要返回的相同形状的数组数量来拆分原数组。

import numpy as np

harr = np.floor(10 *  np.random.random((2,6)))
print('原array:')
print(harr)

print('拆分后：')
print(np.hsplit(harr,3))

原array:
[[7. 4. 4. 8. 9. 2.]
 [3. 9. 0. 3. 3. 4.]]
拆分后：
[array([[7., 4.],
       [3., 9.]]), array([[4., 8.],
       [0., 3.]]), array([[9., 2.],
       [3., 4.]])]

numpy.vsplit 沿着垂直轴分割，其分割方式与hsplit用法相同。

import numpy as np

a = np.arange(16).reshape(4,4)

print('第一个数组：')
print(a)
print('\n')

print('竖直分割：')
b = np.vsplit(a,2)
print(b)

第一个数组：
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]]


竖直分割：
[array([[0, 1, 2, 3],
       [4, 5, 6, 7]]), array([[ 8,  9, 10, 11],
       [12, 13, 14, 15]])]

数组元素的添加与删除

函数	元素及描述
resize	返回指定形状的新数组
append	将值添加到数组末尾
insert	沿指定轴将值插入到指定下标之前
delete	删掉某个轴的子数组，并返回删除后的新数组
unique	查找数组内的唯一元素

numpy.resize 函数返回指定大小的新数组。

如果新数组大小大于原始大小，则包含原始数组中的元素的副本。

numpy.resize(arr, shape)
# arr:要修改大小的数组
# shape:返回数组的新形状

import numpy as np

a = np.array([[1,2,3],[4,5,6]])

print('第一个数组：')
print(a)
print('\n')

print('第一个数组的形状：')
print(a.shape)
print('\n')
b = np.resize(a, (3,2))

print('第二个数组：')
print(b)
print('\n')

print('第二个数组的形状：')
print(b.shape)
print('\n')
# 要注意a的第一行在b中重复出现，因为尺寸变大了

print('修改第二个数组的大小：')
b = np.resize(a, (3,3))
print(b)

第一个数组：
[[1 2 3]
 [4 5 6]]


第一个数组的形状：
(2, 3)


第二个数组：
[[1 2]
 [3 4]
 [5 6]]


第二个数组的形状：
(3, 2)


修改第二个数组的大小：
[[1 2 3]
 [4 5 6]
 [1 2 3]]

numpy.append 函数在数组的末尾添加值。追加操作会分配整个数组，并把原来的数组复制到新数组中。此外，输入数组的维度必须匹配否则将生成ValueError。

append 函数返回的始终是一个一维数组。

numpy.append(arr, values, axis = None)
# arr:输入数组
# values: 要向arr添加的值，需要和arr形状相同（除了要添加的轴）
# axis:默认为None,当axis无定义时，是横向加成，返回总是一维数组；当axis有定义时，分别为0（列数要相同）和1（行数要相同）。

import numpy as np

a = np.array([[1,2,3],[4,5,6]])

print('第一个数组：')
print(a)
print('\n')

print('向数组添加元素：')
print(np.append(a, [7,8,9]))
print('\n')

print('沿轴0添加元素：')
print(np.append(a, [[7,8,9]], axis = 0))
print('\n')

print('沿轴1添加元素：')
print(np.append(a,[[5,5,6],[7,8,9]], axis = 1))

第一个数组：
[[1 2 3]
 [4 5 6]]


向数组添加元素：
[1 2 3 4 5 6 7 8 9]


沿轴0添加元素：
[[1 2 3]
 [4 5 6]
 [7 8 9]]


沿轴1添加元素：
[[1 2 3 5 5 6]
 [4 5 6 7 8 9]]

numpy.insert 函数在给定索引之前，沿给定轴在输入数组中插入值。

如果值的类型转换为要插入，则它与输入数组不同。插入没有原地的，函数会返回一个新数组。此外，如果未提供轴，则输入数组会被展开。

numpy.insert(arr, obj, values, axis)
# arr:输入数组
# obj:在其之前插入值的索引
# values:要插入的值
# axis:沿着它插入的轴，如果未提供，则输入数组会被展开

import numpy as np

a = np.array([[1,2],[3,4],[5,6]])

print('第一个数组：')
print(a)
print('\n')

print('未传递Axis参数。在插入之前输入数组会被展开。')
print(np.insert(a,3,[11,12]))
print('\n')
print('传递了Axis参数。会广播值数组来配输入数组。')

print('沿轴0广播：')
print(np.insert(a,1,[11], axis = 0))
print('\n')

print('沿轴1广播：')
print(np.insert(a,1,11, axis = 1))

第一个数组：
[[1 2]
 [3 4]
 [5 6]]


未传递Axis参数。在插入之前输入数组会被展开。
[ 1  2  3 11 12  4  5  6]


传递了Axis参数。会广播值数组来配输入数组。
沿轴0广播：
[[ 1  2]
 [11 11]
 [ 3  4]
 [ 5  6]]


沿轴1广播：
[[ 1 11  2]
 [ 3 11  4]
 [ 5 11  6]]

numpy.delete 函数返回从输入数组中删除指定子数组的新数组。与 insert() 函数的情况一样，如果未提供轴参数，则输入数组将展开。

Numpy.delete(arr, obj, axis)
# arr:输入数组
# obj:可以被切片，整数或整数数组，表明要从输入数组删除的子数组
# axis:沿着它删除给定子数组的轴，如果未提供，则输入数组会被展开

import numpy as np

a = np.arange(12).reshape(3,4)

print('第一个数组：')
print(a)
print('\n')

print('未传递Axis参数。在插入之前输入数组会被展开。')
print(np.delete(a,5))
print('\n')

print('删除第二列：')
print(np.delete(a,1,axis = 1))
print('\n')

print('包含从数组中删除的替代值的切片：')
a = np.array([1,2,3,4,5,6,7,8,9,10])
print(np.delete(a,np.s_[::2]))

第一个数组：
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]


未传递Axis参数。在插入之前输入数组会被展开。
[ 0  1  2  3  4  6  7  8  9 10 11]


删除第二列：
[[ 0  2  3]
 [ 4  6  7]
 [ 8 10 11]]


包含从数组中删除的替代值的切片：
[ 2  4  6  8 10]

numpy.unique 函数用于去除数组中的重复元素：

numpy.unique(arr, return_index, return_inverse, return_counts)
# arr:输入数组，如果不是一维数组则会展开
# return_index:如果为true，返回新列表元素在旧列表中的位置（下标），并以列表形式储
# return_inverse:如果为true，返回旧列表在新列表中的位置（下标），并以列表形式储
# return_counts：如果为true，返回去重数组中的元素在原数组中的出现次数

import numpy as np

a = np.array([2,4,5,2,6,8,9,4,6])

print('第一个数组：')
print(a)
print('\n')

print('第一个数组的去重值：')
u = np.unique(a)
print(u)
print('\n')

print('去除数组的索引数组；')
u,indices = np.unique(a,return_index = True)
print(indices)
print('\n')

print('去重数组的下标：')
u,indices = np.unique(a,return_inverse = True)
print(u)
print('\n')

print('下标为：')
print(indices)
print('\n')

print('使用下标重构原数组；')
print(u[indices])
print('\n')

print('返回去重元素的重复数量：')
u,indices = np.unique(a,return_counts = True)
print(u)
print(indices)

第一个数组：
[2 4 5 2 6 8 9 4 6]


第一个数组的去重值：
[2 4 5 6 8 9]


去除数组的索引数组；
[0 1 2 4 5 6]


去重数组的下标：
[2 4 5 6 8 9]


下标为：
[0 1 2 0 3 4 5 1 3]


使用下标重构原数组；
[2 4 5 2 6 8 9 4 6]


返回去重元素的重复数量：
[2 4 5 6 8 9]
[2 2 1 2 1 1]

学习参考：

菜鸟教程：https://www.runoob.com/numpy/numpy-tutorial.html

Pluto0054

发布了61 篇原创文章 · 获赞 7 · 访问量 1万+

私信关注