滤波器（Filters）

CNN中的滤波器与加权矩阵一样，它与输入图像的一部分相乘以产生一个回旋输出。我们假设有一个大小为28 * 28的图像，我们随机分配一个大小为3 * 3的滤波器，然后与图像不同的3 * 3部分相乘，形成所谓的卷积输出。滤波器尺寸通常小于原始图像尺寸。在成本最小化的反向传播期间，滤波器值被更新为重量值。

参考一下下图，这里filter是一个3 * 3矩阵：
在这里插入图片描述

与图像的每个3 * 3部分相乘以形成卷积特征。
在这里插入图片描述

卷积神经网络（CNN）

卷积神经网络基本上应用于图像数据。假设我们有一个输入的大小（28 * 28 * 3），如果我们使用正常的神经网络，将有2352（28 * 28 * 3）参数。并且随着图像的大小增加参数的数量变得非常大。我们“卷积”图像以减少参数数量（如上面滤波器定义所示）。当我们将滤波器滑动到输入体积的宽度和高度时，将产生一个二维激活图，给出该滤波器在每个位置的输出。我们将沿深度尺寸堆叠这些激活图，并产生输出量。

你可以看到下面的图，以获得更清晰的印象。
在这里插入图片描述

池化（Pooling）

通常在卷积层之间定期引入池层。这基本上是为了减少一些参数，并防止过度拟合。最常见的池化类型是使用MAX操作的滤波器尺寸（2,2）的池层。它会做的是，它将占用原始图像的每个4 * 4矩阵的最大值。
在这里插入图片描述
你还可以使用其他操作（如平均池）进行池化，但是最大池数量在实践中表现更好。

填充（Padding）

填充是指在图像之间添加额外的零层，以使输出图像的大小与输入相同。这被称为相同的填充
在这里插入图片描述
在应用滤波器之后，在相同填充的情况下，卷积层具有等于实际图像的大小。

有效填充是指将图像保持为具有实际或“有效”的图像的所有像素。在这种情况下，在应用滤波器之后，输出的长度和宽度的大小在每个卷积层处不断减小。

数据增强（Data Augmentation）

数据增强是指从给定数据导出的新数据的添加，这可能被证明对预测有益。例如，如果你使光线变亮，可能更容易在较暗的图像中看到猫，或者例如，数字识别中的9可能会稍微倾斜或旋转。在这种情况下，旋转将解决问题并提高我们的模型的准确性。通过旋转或增亮，我们正在提高数据的质量。这被称为数据增强。
在这里插入图片描述

理想007

发布了650 篇原创文章 · 获赞 190 · 访问量 5万+

私信关注

【Deep Learning笔记】卷积神经网络必须要掌握的知识（看不懂你来打我）

文章目录

滤波器（Filters）

卷积神经网络（CNN）

池化（Pooling）

填充（Padding）

数据增强（Data Augmentation）

猜你喜欢