国外泛读!title(31):Learning Pixel-level Semantic Affinity with Image-level Supervision for Weakly Supervised Semantic Segmentation(在弱监督语义分割中利用图像级监督学习像素级语义相关性)---20180409
由于以往的弱监督分割算法,都未曾考虑被检测目标的位置、形状等特征信息,分割效果差强人意。
这篇文章在监督信息中利用了被检测目标的位置、形状信息。加上其独有的学习方法(大体可以分为三个步骤),使得该算法可以达到出色的语义分割效果,甚至超越了经典的FCN方法。
本文提出的弱监督语义分割方法大致分为两部分:
(1)根据图像级别的类别标签合成训练图像的像素级分割标签;
(2)用生成的分割标签学习DNN进行语义分割。
整个框架基于三个DNN:网络计算CAM(Class Activation Maps),AffinityNet(本文提出的这个网络用于预测一对相邻图像坐标之间的语义相关性)以及一个分割模型。 前两个用于生成训练图像的分割标签,最后一个是执行实际语义分割的DNN,并且用合成的分割注释训练。
本文算法架构: