【实例分割】Faster Training of Mask R-CNN by Focusing on Instance Boundaries

论文：Faster Training of Mask R-CNN by Focusing on Instance Boundaries

Mask R-CNN是实例分割的经典模型，作者通过在Mask R-CNN框架上附加一个新任务，达到更快的网络收敛速度。

该文对MaskR-CNN添加了一个新的预测任务，称为Edge Agreement Head，它的灵感来自人工实例标注的方式。当人们对实例进行像素级标注的时候，仅仅会关注实例的边缘部分，而实例内部则只需要简单的复制边缘的标注信息就可以了。所以实例的mask边缘非常有用，它们很好地表达了实例。

Edge Agreement Head的作用即鼓励深度网络训练时预测的实例mask边缘与groundtruth的边缘相似。

主要解决：降低训练时间，更准确沿着边缘分割

亮点：增加一个边缘预测部分（ Edge Agreement Head）

结果：

由于附加网络分支仅在训练期间相关，因此与Mask R-CNN相比，推断速度保持不变。在默认的Mask R-CNN设置中，与基线相比，MS COCO度量的训练速度提高了29％，整体提升了8.1％。

算法思想

作者通过观察Mask R-CNN训练前期输出的预测图像，发现很多时候边缘都不在点上，显然神经网络在走弯路。如图：

这是Mask R-CNN深度网络训练前期的一些预测的Mask，发现它并没有像人类一样先把边缘找出来，甚至缺失的很离谱（你可以预测的不很精细准确，但至少要表现出在向这个方向努力吧！）。
为了避免神经网络走弯路，作者把实例的边缘信息作为一种监督的指引，即将groundtruth进行边缘滤波，让神经网络同时去预测实例的边缘。

Mask R-CNN的多任务损失函数：