神经网络之卷积和池化(二)

卷积神经网络（CNN）由输入层、卷积层、激活函数、池化层、全连接层组成，即INPUT-CONV-RELU-POOL-FC

(1)卷积层：用它来进行特征提取，如下：
在这里插入图片描述
输入图像是32x32x3，3是它的深度（即R、G、B），卷积层是一个5x5x3 的filter(感受野)，这里注意：感受野的深度必须和输入图像的深度相同。通过一个filter与输入图像的卷积可以得到一个28x28x1的特征图，上图是用了两个filter得到了两个特征图；

我们通常会使用多层卷积层来得到更深层次的特征图。如下：
在这里插入图片描述
关于卷积的过程图解如下：

当 stride=2 时，如下：

如上图，完成卷积，得到一个3x3x1 的特征图；在这里还要注意一点，即zero pad项，即为图像加上一个边界，边界元素均为0.（对原输入无影响）一般有

F=3 => zero pad with 1

F=5 => zero pad with 2

F=7=> zero pad with 3,边界宽度是一个经验值，加上zero pad这一项是为了使输入图像和卷积后的特征图具有相同的维度，如：

输入为5x5x3，filter为3x3x3 ，在zero pad 为1，则加上zero pad后的输入图像为7x7x3，则卷积后的特征图大小为 5x5x1 （（7-3）/1+1），与输入图像一样；

而关于特征图的大小计算方法具体如下：
在这里插入图片描述
卷积层还有一个特性就是“权值共享”原则。如下图：

如没有这个原则，则特征图由10个32321的特征图组成，即每个特征图上有1024个神经元，每个神经元对应输入图像上一块553的区域，即一个神经元和输入图像的这块区域有75个连接，即75个权值参数，则共有75102410=768000个权值参数，这是非常复杂的，因此卷积神经网络引入“权值”共享原则，即一个特征图上每个神经元对应的75个权值参数被每个神经元共享，这样则只需75*10=750个权值参数，而每个特征图的阈值也共享，即需要10个阈值，则总共需要750+10=760个参数。

池化层：对输入的特征图进行压缩，使特征图变小，简化网络计算复杂度；并且进行特征压缩，提取主要特征，如下：
在这里插入图片描述
池化操作一般有两种，一种是Avy Pooling,一种是max Pooling,如下：

同样地采用一个2*2的filter,max pooling是在每一个区域中寻找最大值，这里的stride=2,最终在原特征图中提取主要特征得到右图。

（Avy pooling现在不怎么用了，方法是对每一个2x2 的区域元素求和，再除以4，得到主要特征），而一般的filter取2x2,最大取3x3,stride取2，压缩为原来的1/4.

注意：这里的pooling操作是特征图缩小，有可能影响网络的准确度，因此可以通过增加特征图的深度来弥补（这里的深度变为原来的2倍）。

全连接层：连接所有的特征，将输出值送给分类器（如softmax分类器）。
总的一个结构大致如下：
在这里插入图片描述

另外：CNN网络中前几层的卷积层参数量占比小，计算量占比大；而后面的全连接层正好相反，大部分CNN网络都具有这个特点。因此我们在进行计算加速优化时，重点放在卷积层；进行参数优化、权值裁剪时，重点放在全连接层。

北木.

发布了333 篇原创文章 · 获赞 36 · 访问量 3万+

私信关注

神经网络之卷积和池化(二)

猜你喜欢