卷积:
- 卷积可以被看作一种有效提取图像特征的方法
- 一般会使用一个正方形的卷积核,遍历图片上的每个点。图片区域内,相对应的每一个像素值,都要诚意卷积核内相对应的权重并求和,在加上相应的权重值。
- 输出图片边长 = (输入边长-kernel边长 + 1) / 步长
- padding:对输入图片进行全0填充,以得到相同大小的输出图片的尺寸。
padding = ‘SAME’ padding = ‘VALID’
tf.nn.conv2d(input[batch(一次输入的图片数目), resolution ratio, resolution rate, channel],
kernel[resolution ratio, resolution ratio , channel, kernel number],
核滑动步长[1(固定),横向滑动步长,列滑动步长1(固定)],
padding = 'VALID'
池化:
tf.nn.max_pool(输入描述,池化核描述,池化核滑动步长,padding = ‘SAME’)
- 最大值化可以提取图片纹理,均值池化可以保留背景特征:提取平均值
tf.nn.avg_pool(描述同上)
舍弃
- 在神经网络训练过程中,将一部分神经元按照一定概率从神经网络中暂时舍弃。使用时被舍弃的神经元恢复链接。
tf.nn.dropout(上层输出,暂时舍弃的概率)