图像语义分割(5)-DeepLabV2: 使用深度卷积网络、空洞卷积和全连接条件随机场进行图像语义分割

1. 简介

DeepLabV2是在V1基础上的优化，不同与V1，模型采用Resnet代替VGG-16，提出ASPP代替标准多尺度处理进行多尺度的特征的捕捉和融合，取得了更好的效果。

在这里插入图片描述

进行空洞卷积的两个有效的方法：

通过插入空洞(零)来隐含地对滤波器进行上采样，或等效稀疏地对输入特征图进行采样。通过向im2col函数(从多通道特征图中提取矢量化块)添加稀疏采样底层特征图实现了这一点
用一个等于空洞卷积率 r 等效的因子对输入特征图下采样，对于每一个 $r×r$ 的移位，都对其进行去交织以产生 $r^2$ 大小的的分辨率映射。然后将标准卷积应用于这些中间特征图，并隔行扫描生成原始图像分辨率。通过将多孔卷积变换为常规卷积，可以使用现成的高度优化的卷积方法。

不同于标准的多尺度特征处理方法中，先对图像进行多个不同尺度的放缩然后采用相同参数进行特征提取之后再融合得到最终的结果，空洞卷积空间池化特征金字塔(Atrous Spatial Pyramid Pooling)对相同的输入进行并行的不同采样率的空洞卷积然后进行特征融合，如下图
在这里插入图片描述