【TensorFlow】tf.nn.max_pool实现池化操作

原创 2016年12月04日 14:28:39

max pooling是CNN当中的最大值池化操作，其实用法和卷积很类似

参数是四个，和卷积很类似：

第一个参数value：需要池化的输入，一般池化层接在卷积层后面，所以输入通常是feature map，依然是[batch, height, width, channels]这样的shape

第二个参数ksize：池化窗口的大小，取一个四维向量，一般是[1, height, width, 1]，因为我们不想在batch和channels上做池化，所以这两个维度设为了1

第三个参数strides：和卷积类似，窗口在每一个维度上滑动的步长，一般也是[1, stride,stride, 1]

第四个参数padding：和卷积类似，可以取'VALID' 或者'SAME'

返回一个Tensor，类型不变，shape仍然是[batch, height, width, channels]这种形式

示例源码：

假设有这样一张图，双通道

第一个通道：

第二个通道：

用程序去做最大值池化：

[python] view plain copy

这里步长为1，窗口大小2×2，输出结果：

[python] view plain copy

池化后的图就是：

证明了程序的结果是正确的。

我们还可以改变步长

[python] view plain copy

最后的result就变成：

[python] view plain copy

顺带补充relu函数：

tf.nn.relu(features, name = None)

解释：这个函数的作用是计算激活函数relu，即max(features, 0)。即将矩阵中每行的非最大值置0。

import tensorflow as tf

a = tf.constant([-1.0, 2.0])
with tf.Session() as sess:
    b = tf.nn.relu(a)
    print sess.run(b)

以上程序输出的结果是：[0. 2.]