图像分割(一)

1.图像分割:

图像分割(Segmentation)指的是将数字图像细分为多个图像子区域(像素的集合)(也被称作超像素)的过程,就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。
现有的图像分割方法:基于阈值的分割、区域生长、区域分裂合并、分水岭算法、边缘分割(边缘检测)、直方图法、聚类分析、小波变换等。

2.CNN图像语义分割:

(1)下采样+上采样:Convlution + Deconvlution/Resize
(2)多尺度特征融合:特征逐点相加/特征channel维度拼接
(3)获得像素级别的segement map:对每一个像素点进行判断类别

3.按分割目的划分:

普通分割

将不同分属不同物体的像素区域分开。
如前景与后景分割开,狗的区域与猫的区域与背景分割开。

语义分割

在普通分割的基础上,分类出每一块区域的语义(即这块区域是什么物体)。
如把画面中的所有物体都指出它们各自的类别。

实例分割

在语义分割的基础上,给每个物体编号。
如这个是该画面中的狗A,那个是画面中的狗B。

4.论文:

Fully Convolutional Networks (FCN)

Fully Convolutional Networks for Semantic Segmentation,简称FCN。这篇论文是第一篇成功使用深度学习做图像语义分割的论文。论文的主要贡献有两点:

  1. 提出了全卷积网络。将全连接网络替换成了卷积网络,使得网络可以接受任意大小的图片,并输出和原图一样大小的分割图。只有这样,才能为每个像素做分类。

  2. 使用了反卷积层(Deconvolution)。分类神经网络的特征图一般只有原图的几分之一大小。想要映射回原图大小必须对特征图进行上采样,这就是反卷积层的作用。虽然名字叫反卷积层,但其实它并不是卷积的逆操作,更合适的名字叫做转置卷积(Transposed Convolution),作用是从小的特征图卷出大的特征图。

这是神经网络做语义分割的开山之作。

参考:

[1]https://blog.csdn.net/u010368556/article/details/70175354
[2]https://blog.csdn.net/Julialove102123/article/details/80493066

猜你喜欢

转载自blog.csdn.net/lz739337660/article/details/88913639