图像分割（一）

1.图像分割：

图像分割（Segmentation）指的是将数字图像细分为多个图像子区域（像素的集合）（也被称作超像素）的过程，就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。
现有的图像分割方法：基于阈值的分割、区域生长、区域分裂合并、分水岭算法、边缘分割（边缘检测）、直方图法、聚类分析、小波变换等。

2.CNN图像语义分割：

（1）下采样+上采样：Convlution + Deconvlution／Resize
（2）多尺度特征融合：特征逐点相加／特征channel维度拼接
（3）获得像素级别的segement map：对每一个像素点进行判断类别

3.按分割目的划分：

普通分割

将不同分属不同物体的像素区域分开。
如前景与后景分割开，狗的区域与猫的区域与背景分割开。

语义分割

在普通分割的基础上，分类出每一块区域的语义（即这块区域是什么物体）。
如把画面中的所有物体都指出它们各自的类别。

实例分割

在语义分割的基础上，给每个物体编号。
如这个是该画面中的狗A，那个是画面中的狗B。

4.论文：

Fully Convolutional Networks (FCN)

Fully Convolutional Networks for Semantic Segmentation，简称FCN。这篇论文是第一篇成功使用深度学习做图像语义分割的论文。论文的主要贡献有两点：

提出了全卷积网络。将全连接网络替换成了卷积网络，使得网络可以接受任意大小的图片，并输出和原图一样大小的分割图。只有这样，才能为每个像素做分类。
使用了反卷积层（Deconvolution）。分类神经网络的特征图一般只有原图的几分之一大小。想要映射回原图大小必须对特征图进行上采样，这就是反卷积层的作用。虽然名字叫反卷积层，但其实它并不是卷积的逆操作，更合适的名字叫做转置卷积（Transposed Convolution），作用是从小的特征图卷出大的特征图。

这是神经网络做语义分割的开山之作。

参考：

[1]https://blog.csdn.net/u010368556/article/details/70175354
[2]https://blog.csdn.net/Julialove102123/article/details/80493066