Context Encoding for Semantic Segmentation-CVPR2018【论文理解】

在这里插入图片描述

论文地址:
http://openaccess.thecvf.com/content_cvpr_2018/papers/Zhang_Context_Encoding_for_CVPR_2018_paper.pdf
代码及作者信息:https://hangzhang.org/

先说一句,写论文的时候说的好听,但是要真正解释的时候还是很模糊的~~

文章的核心(初步理解):

分割分类的结合,使用分类修正分割的结果。

两者的结合靠的是SE-loss,而SE-loss的本质就是交叉熵损失函数
网络的其中一个分支负责预测图片中是否有这个类别,比如是否有汽车,图像的场景是海上,则预测有汽车的概率是0.01,那么得到的结果会与特征图进行逐像素相乘,重新规范特征图。
因为物体是否存在依靠的是全图的编码信息,所以不会受物体大小的影响。NICE IDEA!美其名曰:
网络结构如下,可以发现明显的两个分支:Featuremap Attention

在这里插入图片描述
连个分支都是使用全局特征编码之后的特征(FC之前)。
在这里插入图片描述


文章中说要解决的问题是:

Is capturing contextual information the same as increasing the
receptive field size? 捕获上下文的信息就等于增加感受野??所以使用Context Encoding Module?
对于Context Encoding Module的运用还有待理解。。。

参考:Context Encoding for Semantic Segmentation (CVPR 2018 slides 中文)

猜你喜欢

转载自blog.csdn.net/m0_37477175/article/details/84139777
今日推荐