关于建筑物半自动化提取方法的总结

基于边界：

基于边界的交互式提取方法要求用户指定目标边界的少量关键点或大概位置，然后基于目标边界强度和连续性等特征，对目标的边界进行准确跟踪。常见的基于边界方法是Snake算法和智能剪刀（Intelligent Scissors）。基于边界方法被广泛应用，但其缺点明显，如用户对边界进行标记时需要沿边界一圈，尤其是对于具有复杂边界的目标，工作量较大；当目标边界与周围对低对比度较低时，很可能错误标记目标边界的关键点或大概位置。

简单理解是用户指定需要提取物体一周的点。

所谓边缘是指图像中两个不同区域的边界线上连续的像素点的集合，是图像局部特征不连续性的反映，体现了灰度、颜色、纹理等图像特性的突变。通常情况下，基于边缘的分割方法指的是基于灰度值的边缘检测，它是建立在边缘灰度值会呈现出阶跃型或屋顶型变化这一观测基础上的方法。

阶跃型边缘两边像素点的灰度值存在着明显的差异，而屋顶型边缘则位于灰度值上升或下降的转折处。正是基于这一特性，可以使用微分算子进行边缘检测，即使用一阶导数的极值与二阶导数的过零点来确定边缘，具体实现时可以使用图像与模板进行卷积来完成。

首先基于区域的过程大多都是：

图像预处理——初始分割——特征提取——赋权——前景与背景模型选取——阈值设置——提取目标图像——精度检验

扫描二维码关注公众号，回复： 15462218 查看本文章

基于种子点：

此类方法是将图像按照相似性准则分成不同的区域，主要包括种子区域生长法、区域分裂合并法和分水岭法等几种类型。

种子区域生长法是从一组代表不同生长区域的种子像素开始，接下来将种子像素邻域里符合条件的像素合并到种子像素所代表的生长区域中，并将新添加的像素作为新的种子像素继续合并过程，直到找不到符合条件的新像素为止。该方法的关键是选择合适的初始种子像素以及合理的生长准则。

区域分裂合并法的基本思想是首先将图像任意分成若干互不相交的区域，然后再按照相关准则对这些区域进行分裂或者合并从而完成分割任务，该方法既适用于灰度图像分割也适用于纹理图像分割。

分水岭法是一种基于拓扑理论的数学形态学的分割方法，其基本思想是把图像看作是测地学上的拓扑地貌，图像中每一点像素的灰度值表示该点的海拔高度，每一个局部极小值及其影响区域称为集水盆，而集水盆的边界则形成分水岭。该算法的实现可以模拟成洪水淹没的过程，图像的最低点首先被淹没，然后水逐渐淹没整个山谷。当水位到达一定高度的时候将会溢出，这时在水溢出的地方修建堤坝，重复这个过程直到整个图像上的点全部被淹没，这时所建立的一系列堤坝就成为分开各个盆地的分水岭。分水岭算法对微弱的边缘有着良好的响应，但图像中的噪声会使分水岭算法产生过分割的现象。

基于Graph Cuts：

一定会有最优解，但仅限于解决二分类问题，超过二分类则需要进行指数级的比较。且种子点过少或分类背景相近时误差较大。

从GrabCut到OneCut：图像分割 - 知乎

grabcut in one-cut 一种好用快速的图像分割算法_zhangyumengs的博客-CSDN博客

经典图割算法中图的构建及实现:Graph-Cut_PandasRan的博客-CSDN博客_graphcut

Graph Cuts

第一种顶点和边是：第一种普通顶点对应于图像中的每个像素。每两个邻域顶点（对应于图像中每两个邻域像素）的连接就是一条边。这种边也叫n-links。

第二种顶点和边是：每个普通顶点和这2个终端顶点之间都有连接，组成第二种边。这种边也叫t-links。

每条边都有权重，Graph Cuts中的cut是指图中的边集合的一个子集，cut中的所有边的权重和被叫做cut。Graph Cuts中的cuts是指这样一个边的集合，很显然这些边集合包括了上面2种边，该集合中所有边的断开会导致残留”S”和”T”图的分开，所以就称为“割”。如果一个割，它的边的所有权值之和最小，那么这个就称为最小割，也就是图割的结果。而福特-富克森定理表明，网路的最大流max flow与最小割min cut相等。所以由Boykov和Kolmogorov发明的max-flow/min-cut算法就可以用来获得s-t图的最小割。这个最小割把图的顶点划分为两个不相交的子集S和T，其中s ∈S，t∈ T和S∪T=V 。这两个子集就对应于图像的前景像素集和背景像素集，那就相当于完成了图像分割。

基于矩形框（GrabCut）：

用户指出背景区域，不需要指出前景区域。

如果背景比较复杂或者背景和目标相似度很大不太好分割，且速度有点慢。

（1）Graph Cut的目标和背景的模型是灰度直方图，Grab Cut取代为RGB三通道的混合高斯模型GMM；

（2）Graph Cut的能量最小化（分割）是一次达到的，而Grab Cut取代为一个不断进行分割估计和模型参数学习的交互迭代过程；

（3）Graph Cut需要用户指定目标和背景的一些种子点，但是Grab Cut只需要提供背景区域的像素集就可以了。也就是说你只需要框选目标，那么在方框外的像素全部当成背景，这时候就可以对GMM进行建模和完成良好的分割了。即Grab Cut允许不完全的标注（incomplete labelling）。

图像分割之（三）从Graph Cut到Grab Cut_zouxy09的博客-CSDN博客

基于Graph Cuts的one cut

GrabCut in One Cut(基于图割算法grabcut的一次快速图像分割的OpenCV实现)----目前效果最好的图割_shiter的博客-CSDN博客_grabcut in one cut

经典图割算法中图的构建及实现:one-Cut_PandasRan的博客-CSDN博客_onecut

one-cut最主要的改进在于将原始图割的先验惩罚项进行了修改。使用全图的前景与背景直方图的L1距离表示先验惩罚项。作者表示该修改能提升性能，并且解决了grab-cut的画框方式中NP难的问题。在grab-cut中需要用EM算法迭代，其不一定能求解到全局最优解，而one-cut可以直接求解到准则函数的最优解。

：

基于多星形约束图割的直角建筑物交互式提取：

可归类为基于区域生长的种子线分割，加入了多星形形状的先验信息提高图像分割的准确率，将星形形状约束加入到Graph Cuts 框架中得到融合星形形状先验的图割模型，当能量函数的最小时，图像的分割结果最优，基于星形约束图割的目标就是在所有的星形形状集合中找到能使能量函数最小的星形形状，从而得到最优分割结果。

技术路线就是先对图像进行预处理——对图像进行超像素分割（利用超像素取代单个像素将有效降低图像处理的复杂度），使用的是简单线性迭代聚类算法——再通过人工交互的种子线得到目标前景与背景超像素——使用基于多星形约束图割方法获得建筑物图斑——最后进行建筑物图斑轮廓规则化。