深度学习中的卷积和池化

其他 2018-09-22 16:17:01 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/q361239731/article/details/80784502

1. Convolution

卷积是什么？

卷积在数学上用通俗的话来说就是输入矩阵与卷积核（卷积核也是矩阵）进行对应元素相乘并求和，所以一次卷积的结果的输出是一个数，最后对整个输入输入矩阵进行遍历，最终得到一个结果矩阵，下面通过一个动画使其更直观。

卷积动画演示
- 卷积核

卷积动画演示

卷积动画演示

在上面我们没有使用很专业的数学公式来表示，来解释卷积操作和相关操作，我结合我自己的理解，争取做到白话，及时没有数学基础，也能理解卷积核池化操作。

卷积的目的

卷积在图像中的目的就是为了提取特征，我认为这就是深度学习的核心，因为有了卷积层，才避免了我们来手动提取图像的特征，让卷积层自动提取图像的高维度且有效的特征，虽然这没有手动提取特征比如Canny边缘，SIFT，HOG等的强大数学理论基础的支撑，但是卷积层提取的特征让最终的分类、识别结果往往非常的好。比如LeNet-5模型能在MNIST数据集上达到99%的识别率，一般来说网络结构越复杂，越深，往往最终的精确率会越高。

卷积分为许多种，下面将会一一介绍。

符号约定

i: 输入大小表示为i*i

k: 卷积核大小表示为k*k

s: 步长

p: 填充

o: 输出表示为o*o

1.1 unit strides

卷积从大体上可以分为单位步长（unit strides)和非单位步长（Non-unit strides），还可以细分为有0填充和无0填充。

1.1.1 No zero padding, unit strides

figure2.1

无零填充单位步长的卷积，蓝色矩阵是输入（4x4）,深蓝色是卷积核（3x3）,上方绿色是输出（2x2）.输出矩阵大小的计算公式为：
figure2.1

动画演示
figure2.1

1.1.2 Zero padding, unit strides

figure2.2

有零填充（p=2）单位步长的卷积，蓝色矩阵是输入（5x5）,深蓝色是卷积核（3x3）,上方绿色是输出（6x6）.输出矩阵大小的计算公式为：
figure2.2

动画演示
figure2.2

1.1.2.1 Zero padding, unit strides - Half(Same) padding

这种情况叫Half Padding 也叫 Same Padding，因为它能保证输入和输出的尺寸是一致的
figure2.3

有零填充（p=1）单位步长的卷积，蓝色矩阵是输入（5x5）,深蓝色是卷积核（3x3）,上方绿色是输出（5x5）.输出矩阵大小的计算公式为：
figure2.3

动画演示
figure2.3

1.1.2.2 Zero padding, unit strides - Full padding

卷积操作产生的输出一般都会减少输入图片的尺寸，但有时候我们需要放大输入图片的尺寸，这个时候就需要使用到Full Padding。
figure2.4

有零填充（p=2）单位步长的卷积，蓝色矩阵是输入（5x5）,深蓝色是卷积核（3x3）,上方绿色是输出（7x7）.输出矩阵大小的计算公式为：
figure2.4

动画演示
figure2.4

1.2 Non-unit strides

接下来介绍非单位步长（Non-unit stride)的卷积操作，分为有零填充和无零填充。

1.2.1 No zero padding, non-unit strides

figure2.5

无零填充非单位步长（s=2）的卷积，蓝色矩阵是输入（5x5）,深蓝色是卷积核（3x3）,上方绿色是输出（2x2）.输出矩阵大小的计算公式为：
figure2.5

其中向下取整是为了避免(i-k)/s是小数的情况。

动画演示
figure2.5

1.2.2 Zero padding, non-unit strides

figure2.6

有零填充（p=1）非单位步长（s=2）的卷积，蓝色矩阵是输入（5x5）,深蓝色是卷积核（3x3）,上方绿色是输出（3x3）.输出矩阵大小的计算公式为：
figure2.6

其中向下取整是为了避免(i+2p-k)/s是小数的情况。

动画演示
figure2.6

1.3 Convolution as a matrix operation

卷积操作也可以被表示为矩阵的形式，比如将1.1.1中的图转化为矩阵，如下图所示：

1.1.1中的图被表示为如下形式

figure2.6

矩阵表示的形式

figure2.6

我将上面的矩阵划分为了4行，每一行划分为了4列，表示此卷积操作需要进行16次，W0,0 W0,1 …… W2,2我在图中标注了出来。这个矩阵可以这样来看，按行来看，第一行对应于矩阵表示图的第一个图，第二行对应于矩阵表示图的第二个图，一次类推。

2. Pooling

池化操作是什么？

池化操作的过程和卷积很类似，但是卷积是用来提取特征的，池化层是用来减少卷积层提取的特征的个数的，可以理解为是为了增加特征的鲁棒性或者是降维。

池化分为平均值池化和最大值池化，下面会一一介绍。

2.1 Average Pooling

平均值池化可以被表示为

figure1.5

平均值池化的动画演示

figure1.6

可以看到池化操作也有一个类似于卷积的核，但是这个核不需要提供值，只是表示一个能作用于输入图片的窗口大小。

2.2 Max Pooling

最大值池化可以被表示为

figure1.6

最大值池化的动画演示

figure1.6

可以看到池化操作也有一个类似于卷积的核，但是这个核不需要提供值，只是表示一个能作用于输入图片的窗口大小。

3. 3D-Conv

3维的卷积，我个人的简单理解，就是在2维卷积的基础上加了一个深度的概念，如图。

figure1.6

输入是一个32x32x3的矩阵，卷积核假定是5x5x3，可以看到一次的卷积操作的结果就是一个带有深度的单位矩阵（2维的一次卷积操作的结果是深度为1的单位矩阵）。这里的深度可以自己指定。

为了更好的理解3维的卷积，这里引用斯坦福写的一篇博客里面的动画。http://cs231n.github.io/convolutional-networks/

4. LeNet-5

这里介绍下LeNet-5模型，为了理解前面讲述的各种模型

Bibliography

猜你喜欢

转载自blog.csdn.net/q361239731/article/details/80784502

深度学习中的卷积和池化

深度学习中卷积和池化的总结

深度学习之卷积和池化

深度学习：卷积池化

深度学习-CNN中池化层和卷积层的反向传播

深度学习 - 卷积层和池化层

深度学习--说一说卷积和池化

卷积池化计算深度学习

深度学习笔记 5 卷积、池化

【深度学习】卷积神经网络的卷积层和池化层计算

【深度学习】6-3 卷积神经网络 - 卷积层和池化层的实现

深入学习卷积神经网络中卷积层和池化层的意义

深入学习卷积神经网络中卷积层和池化层的意义（转）

深度学习基础--卷积计算和池化计算公式

【深度学习】基于im2col的展开Python实现卷积层和池化层

PaddlePaddle入门深度学习（四）：卷积神经网络基础之池化和Relu

自己动手实现深度学习框架-6 卷积层和池化层

池化和卷积

卷积和池化

【深度学习】卷积层与池化层的参数计算

十四、深度学习之卷积+池化+全连接各层

深度学习系列教程目录深度学习（一）神经网络中的池化与反池化原理深度学习（二）神经网络中的卷积和反卷积原理深度学习（三）转-可视化理解卷积神经网络直接查看卷积神经网络的过程特征深度学习（四）转--入门深度学习的一些开源代码深度学习（五）基于tensorflow实现简单卷积神经网络Lenet５深度学习（六）keras常用函数学习深度学习（七）U-Net原理以及keras代码实现医学图像眼球血管分割

图像处理中的卷积、池化、反卷积和反池化的理解与思考

深度学习中的各种池化方法

机器学习：深度学习中的卷积和反卷积

[深度学习]卷积神经网络：卷积、池化、常见分类网络

深度学习：卷积神经网络，卷积，激活函数，池化

深度学习中的卷积(conv)和空洞卷积(dilated conv)

卷积和池化的区别

CNN卷积和池化

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)