cvpr17的一篇文章，作者：Min Bai； Raquel Urtasun
https://arxiv.org/pdf/1611.08303.pdf
之前效果较好的 Instance segmentation主要是使用proposal的方式，比如FCIS或者Mask rcnn，本文提出了骨骼清奇的深度分水岭的方法。

1. Watershed Transform

首先来说一下传统的分水岭算法：
我们按照图片的灰度值的梯度可以绘制一个“地形图”，然后将在各个局部极小值的地方开始灌水，为防止不同区域内的水相通，变建立“大坝”将其分各开，也就将图分割为独立的几个区域。如下图：
这里写图片描述

传统利用分水岭的方法容易由于噪声的原因产生过度分割的现象，本文结合深度卷积网络，学习一个特征代替传统分水岭算法中的图形灰度图的梯度值。
也就是由下图中的a变为了b，其学习的目的就是每个instance 一个 basin的区域。
这里写图片描述

2. Deep Watershed Tranform

为了学习到上面所说的energy landscape，文章将网络分为了两部分，首先学习‘ the directionof descent of the watershed energy’所用的网络称为 Direction Net，在此基础上学习最终的Energy。训练时首先对两部分分别预训练然后进行end2end的finetune。网络结构如下：

这里写图片描述