【TensorFlow】tf.nn.max_pool实现池化操作

【TensorFlow】tf.nn.max_pool实现池化操作

原创 2016年12月04日 14:28:39

max pooling是CNN当中的最大值池化操作,其实用法和卷积很类似

有些地方可以从卷积去参考【TensorFlow】tf.nn.conv2d是怎样实现卷积的? 

tf.nn.max_pool(value, ksize, strides, padding, name=None)

参数是四个,和卷积很类似:

第一个参数value:需要池化的输入,一般池化层接在卷积层后面,所以输入通常是feature map,依然是[batch, height, width, channels]这样的shape

第二个参数ksize:池化窗口的大小,取一个四维向量,一般是[1, height, width, 1],因为我们不想在batch和channels上做池化,所以这两个维度设为了1

第三个参数strides:和卷积类似,窗口在每一个维度上滑动的步长,一般也是[1, stride,stride, 1]

第四个参数padding:和卷积类似,可以取'VALID' 或者'SAME'

返回一个Tensor,类型不变,shape仍然是[batch, height, width, channels]这种形式


示例源码:

假设有这样一张图,双通道

第一个通道:

第二个通道:

用程序去做最大值池化:

[python] view plain copy
  1. import tensorflow as tf  
  2.   
  3. a=tf.constant([  
  4.         [[1.0,2.0,3.0,4.0],  
  5.         [5.0,6.0,7.0,8.0],  
  6.         [8.0,7.0,6.0,5.0],  
  7.         [4.0,3.0,2.0,1.0]],  
  8.         [[4.0,3.0,2.0,1.0],  
  9.          [8.0,7.0,6.0,5.0],  
  10.          [1.0,2.0,3.0,4.0],  
  11.          [5.0,6.0,7.0,8.0]]  
  12.     ])  
  13.   
  14. a=tf.reshape(a,[1,4,4,2])  
  15.   
  16. pooling=tf.nn.max_pool(a,[1,2,2,1],[1,1,1,1],padding='VALID')  
  17. with tf.Session() as sess:  
  18.     print("image:")  
  19.     image=sess.run(a)  
  20.     print (image)  
  21.     print("reslut:")  
  22.     result=sess.run(pooling)  
  23.     print (result)  
这里步长为1,窗口大小2×2,输出结果:
[python] view plain copy
  1. image:  
  2. [[[[ 1.  2.]  
  3.    [ 3.  4.]  
  4.    [ 5.  6.]  
  5.    [ 7.  8.]]  
  6.   
  7.   [[ 8.  7.]  
  8.    [ 6.  5.]  
  9.    [ 4.  3.]  
  10.    [ 2.  1.]]  
  11.   
  12.   [[ 4.  3.]  
  13.    [ 2.  1.]  
  14.    [ 8.  7.]  
  15.    [ 6.  5.]]  
  16.   
  17.   [[ 1.  2.]  
  18.    [ 3.  4.]  
  19.    [ 5.  6.]  
  20.    [ 7.  8.]]]]  
  21. reslut:  
  22. [[[[ 8.  7.]  
  23.    [ 6.  6.]  
  24.    [ 7.  8.]]  
  25.   
  26.   [[ 8.  7.]  
  27.    [ 8.  7.]  
  28.    [ 8.  7.]]  
  29.   
  30.   [[ 4.  4.]  
  31.    [ 8.  7.]  
  32.    [ 8.  8.]]]]  
池化后的图就是:

证明了程序的结果是正确的。


我们还可以改变步长

[python] view plain copy
  1. pooling=tf.nn.max_pool(a,[1,2,2,1],[1,2,2,1],padding='VALID')  
最后的result就变成:
[python] view plain copy
  1. reslut:  
  2. [[[[ 8.  7.]  
  3.    [ 7.  8.]]  
  4.   
  5.   [[ 4.  4.]  
  6.    [ 8.  8.]]]] 

顺带补充relu函数:

tf.nn.relu(features, name = None)

解释:这个函数的作用是计算激活函数relu,即max(features, 0)。即将矩阵中每行的非最大值置0。

import tensorflow as tf

a = tf.constant([-1.0, 2.0])
with tf.Session() as sess:
    b = tf.nn.relu(a)
    print sess.run(b)
以上程序输出的结果是:[0. 2.]

猜你喜欢

转载自blog.csdn.net/tiankongtiankong01/article/details/80073875