分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow

也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！

broadcasting，广播，传递，赋值，拷贝；

一定要注意，执行 broadcast 的前提在于，两个 ndarray 执行的是 element-wise（按位加，按位减）的运算，而不是矩阵乘法的运算，矩阵乘法运算时需要维度之间严格匹配。（且矩阵乘法，np.dot(A, B) 如果维度不匹配，提示的错误不会是 broadcast，而是 aligned）

我们常常会看到 python 编译器会提示如下类型的错误：

ValueError: operands could not be broadcast together with shapes (8,4,3) (2,1)
   
   
    
    1

那么如何理解这里的broadcast呢，matlab中并无对等的概念？

broadcasting机制的功能是为了方便不同shape的array（numpy库的核心数据结构）进行数学运算。

举一个简单的例子，实现对一个1-d array的每一个元素乘以2：

>>> a = np.array([1., 2., 3.])>>> b = np.array([2., 2., 2.])>>> a*barray([2., 4., 6.])
   
   
    
    1
    
    2
    
    3
    
    4

broadcast的做法是：

>>> a = np.array([1., 2., 3.])>>> b = 2.>>> a*barray([2., 4., 6.])
   
   
    
    1
    
    2
    
    3
    
    4

这也就解释了之前常常令人困惑的(3, )不同于(3, 1)（表shape）。

我们来看更为一般的broadcasting rules：

当操作两个array时，numpy会逐个比较它们的shape（构成的元组tuple），只有在下述情况下，两arrays才算兼容：

相等
其中一个为1，（进而可进行拷贝拓展已至，shape匹配）

1. 举例

举例说明：

Image (3d array):  256 x 256 x 3Scale (1d array):              3Result (3d array): 256 x 256 x 3A      (4d array):  8 x 1 x 6 x 1B      (3d array):      7 x 1 x 5Result (4d array):  8 x 7 x 6 x 5A      (2d array):  5 x 4B      (1d array):      1Result (2d array):  5 x 4A      (2d array):  15 x 3 x 5B      (1d array):  15 x 1 x 5Result (2d array):  15 x 3 x 5
   
   
    
    1
    
    2
    
    3
    
    4
    
    5
    
    6
    
    7
    
    8
    
    9
    
    10
    
    11
    
    12
    
    13
    
    14
    
    15

再来看一些不能进行broadcast的例子：

A  (1d array): 3B  (1d array): 4        # 最后一维（trailing dimension）不匹配A  (2d array):      2 x 1B  (3d array):  8 x 4 x 3（倒数第二维不匹配）
   
   
    
    1
    
    2
    
    3
    
    4
    
    5

我们再来看一些具体的应用：

>>> x = np.arange(4)>> xx = x.reshape(4, 1)>> y = np.ones(5)>> z = np.ones((3, 4))>>> x.shape(4,)>>> y.shape(5,)>>> x+yValueError: operands could not be broadcast together with shapes (4,) (5,) >>> xx.shape(4, 1)>>> y.shape(5,)>>> (xx+y).shape(4, 5)>>> xx + yarray([[ 1.,  1.,  1.,  1.,  1.],       [ 2.,  2.,  2.,  2.,  2.],       [ 3.,  3.,  3.,  3.,  3.],       [ 4.,  4.,  4.,  4.,  4.]])
   
   
    
    1
    
    2
    
    3
    
    4
    
    5
    
    6
    
    7
    
    8
    
    9
    
    10
    
    11
    
    12
    
    13
    
    14
    
    15
    
    16
    
    17
    
    18
    
    19
    
    20
    
    21
    
    22
    
    23

当执行xx+y时，numpy是如何进行copy扩展的呢？

xx     (2d array):      4 x 1y      (1d array):          5Result (2d array):      4 x 5
   
   
    
    1
    
    2
    
    3

也即对xx重复5列，对y重复4行

# 对xx重复5列# 等价于np.dot(xx, np.ones((1, 4)))array([[ 0.,  0.,  0.,  0.],       [ 1.,  1.,  1.,  1.],       [ 2.,  2.,  2.,  2.],       [ 3.,  3.,  3.,  3.]])# 对y重复4行，array([[ 1.,  1.,  1.,  1.,  1.],       [ 1.,  1.,  1.,  1.,  1.],       [ 1.,  1.,  1.,  1.,  1.],       [ 1.,  1.,  1.,  1.,  1.]])
   
   
    
    1
    
    2
    
    3
    
    4
    
    5
    
    6
    
    7
    
    8
    
    9
    
    10
    
    11
    
    12

2. 补充

还有一点，注意和矩阵乘法的区别，当有一维数组参与运算时：

一维数组置于矩阵乘法的左部，被视为一个行向量；
一维数组置于矩阵乘法的右部，被视为一个列向量；
（这样和一个一维数组作用无论在左还是在右）矩阵乘法运算结束得到的向量仍是一维数组。

x   (1d array)  ->  5       ->  1, 5W   (2d array)  ->  5, 3    ->  5, 3                            ->  3 (1d array)
   
   
    
    1
    
    2
    
    3

>>> import numpy>>> x = numpy.random.randn(5)>>> x.shape(5,)>>> x.T.shape(5,)                # 一维数组x并非严格意义上的行向量>>> W = numpy.random.randn(5, 3)>>> numpy.dot(x, W)array([ 0.06489021, -3.08729591,  1.52169767])>>> numpy.dot(x, W).shape(3, )>>> y = numpy.ones(3)>>> y.shape(3,)>>> W.dot(y).shape(5,)
   
   
    
    1
    
    2
    
    3
    
    4
    
    5
    
    6
    
    7
    
    8
    
    9
    
    10
    
    11
    
    12
    
    13
    
    14
    
    15
    
    16
    
    17
    
    18

references

[1]broadcasting

给我老师的人工智能教程打call！http://blog.csdn.net/jiangjunshow

numpy 中的 broadcasting 广播机制

1. 举例

2. 补充

references

给我老师的人工智能教程打call！http://blog.csdn.net/jiangjunshow

猜你喜欢

numpy 中的 broadcasting 广播 机制

1. 举例

2. 补充

references

给我老师的人工智能教程打call！http://blog.csdn.net/jiangjunshow

猜你喜欢

numpy 中的 broadcasting 广播机制