（1）局部视野
卷积操作在运算的过程中，一次只考虑一个窗口的大小，因此其具有局部视野的特点，局部性主要体现在窗口的卷积核的大小。
（2）权重共享
从上面的讲解可以看到，对一个输入为5∗5，卷积核为3∗3的情况下，对于每一个滑动窗口，使用的都是同一个卷积核，所以其参数共享。
（3）多个卷积核可以发现不同角度的特征，多个卷积层可以捕捉更全局的特征（处于卷积网络更深的层或者能够的单元，他们的接受域要比处在浅层的单元的接受域更大）

2. 卷积分类与计算

2.1 标准卷积

标准卷积核与目标图像矩阵进行卷积运算，多少数量的卷积核，就会对应多少的特征图。

单通道（卷积核（kernel）为3×3、步长（stride）为1、填充（padding）为0）

多通道 ，拥有多个通道的卷积，例如处理彩色图像时，分别对R, G, B这3个层处理的3通道卷积

多个卷积核，若有多个卷积核，对应多个feature map，也就是下一个输入层有多个通道。如下图所示

2.2 反卷积（转置卷积）

转置卷积也被称为反卷积，先按照一定的比例通过补0来扩大输入图像的尺寸，接着旋转卷积核（矩阵转置），再进行正向卷积。

它可以看作是普通卷积的一个“对称”操作，这种“对称性体现在以下两个方面”
转置卷积能将普通卷积中输入到输出的尺寸变换逆反过来，反卷积的操作只是恢复了矩阵的尺寸大小，并不能恢复的每个元素的原始值。
转置卷积的信息正向传播于普通卷积的误差反向传播所用的矩阵相同，反之亦然
普通卷积和转置卷积所处理的基本任务是不同的。前者主要用来做特征提取，倾向于压缩特征图尺寸，后者主要用于对特征图进行扩张或上采样，代表性的场景如下:
语义分割/实例分割
些物体检测、关键点检测
图像的自编码器、变分自编码器、生成对抗网络等

在卷积操作中： cx=y
在反卷积操作中： c^T y=x
这里并不是严格意义上的等于，而只是维度的相等，因为c 和 c^T都是训练，并不是直接取转置。

2.3 空洞卷积

空洞卷积是针对图像语又分割问题中下来样会降低图像分解率、去失信息而提出的种卷积思路。利用添加空洞扩大感受野，让原本3x3的卷积核，在相同参数量和计算量下拥有5x5 (dilated rate =2)或者更大的感受野，从而无需下采样。

空洞卷积或者膨胀卷积是在标准的卷积核里注入空洞，利用添加空洞扩大感受野，让原本3x3的卷积核，在相同参数量和计算量下拥有5x5（dilated rate =2）或者更大的感受野，从而无需下采样。相比原来的正常convolution，dilated convolution 多了一个超参数称之为 dilation rate（空洞率d） 指的是kernel的间隔数量(e.g. 标准卷积的空洞率是1)，即在内核元素之间插入d-1个空格。当d=1时，则内核元素之间没有插入空格，变为标准卷积优点是在保持同等计算量的情况下可以扩大感受野，缺点是存在网格效应。

空洞卷积优点
在不做pooling损失信息和相同的计算条件下的情况下，加大了感受野，让每个卷积输出都包含较大范围的信息。空洞卷积经常用在实时图像分割中。当网络层需要较大的感受野，但计算资源有限而无法提高卷积核数量或大小时，可以考虑空洞卷积
空洞卷积缺点
Dilated Convolution的kerel并不连续，也就是并不是所有的像素都用来计算了，因此这里将信息看作checker-board的方式将会损失信息的连续性。(即栅格效应，膨胀卷积不能覆盖所有的图像特征)

2.4 深度可分离卷积

Depthwise Separable Convolution（深度可分离卷积）是将一个完整的卷积运算分解为两步运行，即Depthwise卷积 与 Pointwise卷积

逐深度卷积(滤波)：将单个滤波器应用到每一个输入通道，Depthwise convolution的一个卷积核只负责一个通道，即一个通道只被一个卷积核卷积。

一张5×5像素、三通道彩色输入图片（shape为5×5×3），Depthwise Convolution首先经过第一次卷积运算，DW完全是在二维平面内进行。卷积核的数量与上一层的通道数相同（通道和卷积核一一对应）。所以一个三通道的图像经过运算后生成了3个Feature map(如果有same padding则尺寸与输入层相同为5×5)，如下图所示。

逐点卷积(组合)： Pointwise 卷积运算则是常规的运算，用1*1的卷积组合不同深度卷积的输出，得到一组新的输出。卷积核的尺寸为 1×1×M，M为上一层的depth。这里的卷积运算会将上一步的map在深度方向上进行加权组合，生成新的Feature map。有几个Filter就有几个Feature map，计算参数量为 1x1x3x4=12。

2.5 分组卷积

Group convolution 分组卷积，最早在AlexNet中出现，由于当时的硬件资源有限，训练AlexNet时卷积操作不能全部放在同一个GPU处理，因此作者把feature maps分给多个GPU分别进行处理，最后把多个GPU的结果进行融合。就是将特征图分成两半或几部分，卷积后再组合，组合方式一般是concate。