DeepLab论文阅读记录

前言:

{

    最近都是在学习目标检测的相关知识,在https://blog.csdn.net/u013580397/article/details/78508392中大概看了一下,发现语义分割的很多模型我都没了解过,所以就从效果最好的DeepLab开始了解,并且记录了自己的一些理解。

    论文地址:https://arxiv.org/pdf/1606.00915.pdf

}

正文:

{

    第一节中首先介绍了深度卷积神经网络(DCNN)的局限性:1,降低分辨率(特征图的分辨率减小,分类不输出分辨率);2,(输入)存在不同尺度的目标(分类不考虑尺度);和3,降低定位精度(分类也不考虑位置)。

    对于局限性1,采用了上采样(upsample)过滤器(filter)的结构来代替最后几层池化层的下采样(downsampe)算子,并且提出了空洞卷积(atrous convolution),其输出和输入的长宽完全相同。

    对于局限性2,使用了不同尺度的过滤器来处理输入图像。因此多个平行的空洞卷积层就形成了,并且称这种技术为空洞空间金字塔池化(ASPP)。

    并且对于局限性3,使用了超列(hyper-column)的思想。

   

    第三节是改动的主要内容。

    在一维的情况下,标准卷积与空洞卷积的对比入图2。

   

    二维情况下降采样与空洞卷积的对比如图3。

   

    上两图中没有说明的是,在空洞卷积前会用0膨胀输入数据(如果rate=r,则在每两个数据点之间插入r-1个0)。这样做的好处是无需额外的参数和计算即可获得较大的特征图(相比于先卷积再反卷积的操作)。

    空洞卷积只是保持维度,所以作者使用了双线性插值以增加维度。

    这里的空洞卷积的两种实施方式我还没看懂。

    关于多尺度的计算,作者使用了多个尺度的空洞卷积,如图7中的(b)。另外,作者还实验了另一种方式,即在不同尺度的DCNN后加上线性插值操作,并且最后融合得到的所有特征图。

   

    在空洞卷积后连接了全连接条件随机场,条件随机场的知识我还不是很了解,论文中也没说的很清楚,只说有利于为空间上相近的像素分配相同的标签。

   

    第四节介绍了实现内容,作者把很多内容都放到了这一节。

    首先,作者进行了单空洞卷积结构的实验。将VGG-16或ResNet-101网络作为本论文模型的DCNN部分,DCNN部分与CRF部分分开训练。DCNN部分使用了迁移学习,将此网络的最后的一维分类层改成了二维的分类层以进行语义分割的训练,分类层宽和高都为输入的1/8,当然标签图的宽和高也等比例地缩小了,损失函数使用的是所有点的交叉熵函数,训练参数如下:

    batch size = 20,

    initial learning  rate  = 0 . 001 ( 最后的分类层为0 . 01),

    每2000迭代,learning  rate*0.1,

    momentum = 0.9,

    并且weight decay = 0.0005。

    CRF的参数确定方式我之后在其他的地方了解,这里作者也是用了论文[22]的方法。

    不同空洞卷积得到的结果如表1。

   

    结果最好的就是图7中的(a)结构。

    作者还尝试了另一种learning  rate的变换方式“poly”:learning  rate*,其中power=0.9。效果更好。

    之后进行了图7中(a)结构与(b)结构的对比,结果如表3。

   

    其中,(b)结构有两种:ASPP-S和ASPP-L,ASPP-S的rate = {2, 4, 8, 12},并且ASPP-L的rate = {6,12, 18, 24}。

    作者给出了两种DCNN方案的效果,如图10。

   

    可以看到,使用ResNet的效果最好。

    与其他模型的对比如表5。

   

   

    The state of the art.

}

结语:

{

    我认为,此论文中的模型最重要的部分就是金字塔空洞卷积之后添加条件随机场模型。空洞卷积即降低了性能要求,又扩大了感受野(Field-of-View)。

    DCNN部分应该可以使用分类准确率更高的模型。

    论文[22]《Efficient inference in fully connected crfs with gaussian edge potentials》已经被我加入到计划任务,不过我不知道是不是也需要其他的一些基础。

    全都是个人理解,也跳过了原文的不少地方,如有不当欢迎指出。

}

猜你喜欢

转载自blog.csdn.net/fish_like_apple/article/details/82748819
今日推荐