opencv学习(二十三):形态学操作

图像的形态学处理

        数学形态学(Mathematical morphology)是一门 建立在格论和拓扑学基础之上的图像分析学科,是数学形态学图像处理的基本理论。其基本的运算包括:腐蚀和膨胀、开运算和闭运算、骨架抽取、极限腐蚀、击中击不中变换、形态学梯度、Top-hat变换、颗粒分析、流域变换等。

        膨胀、腐蚀、开运算和闭运算是数学形态学的四个基本运算,它们在二值图像和灰度图像中各有特点。基于这些运算还可推导和组合成各种数学形态学实用算法,用它们可以进行图像形状和结构的分析和处理,包括图像分割、特征提取、边缘检测、图像滤波、图像增强和恢复等。有关数学形态学更多的介绍,可以查看百度词条:数学形态学。

         简单来讲,形态学操作就是基于形状的一系列图像处理操作。opencv为进行图像的形态学变换提供了快捷,方便的函数,最基本的形态学操作有二种,他们是:膨胀和腐蚀(Dilation与Erosion)

  膨胀与腐蚀能实现多种多样的功能,主要如下:

  • 消除噪声
  • 分割(isolate)出独立的图像元素,在图像中连接(join)相邻的元素。
  • 寻找图像中的明显的极大值区域或极小值区域
  • 求出图像的梯度

   在进行腐蚀和膨胀的讲解之前,首先需要注意: 腐蚀和膨胀是对白色部分(高亮部分)而言的,不是黑色部分。 膨胀就是图像中的高亮部分进行膨胀,“邻域扩张”,效果图拥有比原图更大的高亮区域。腐蚀就是原图中高亮部分被腐蚀,“邻域被蚕食”,效果图拥有比原图更小的高亮区域。

图像的膨胀和腐蚀

         定义结构元素是数学形态学处理的核心,在OpenCV中可以使用其自带的getStructuringElemet函数,也可以直接使用numpy数组来定义一个结构元素。

膨胀

 其实,膨胀就是求局部最大值的操作。

 按数学方面来说,膨胀或者腐蚀操作就是将图像(或图像的一部分区域,我们称之为A)与核(我们称之为B)进行卷积。

 核可以是任何的形状和大小,它拥有一个单独定义出来的参考点,我们称其为锚点(anchorpoint)。多数情况下,核是一个小的中间带有参考点和实心正方形或者圆盘,其实,我们可以把核视为模板或者掩码。   

而膨胀就是求局部最大值的操作,核B与图形卷积,即计算核B覆盖的区域的像素点的最大值,并把这个最大值赋值给参考点指定的像素。这样就会使图像中的高亮区域逐渐增长。如下图所示,这就是膨胀操作的初衷。

膨胀的数学表达式:  

膨胀效果图(毛笔字):

   

腐蚀

    再来看一下腐蚀,,大家应该知道,膨胀和腐蚀是一对好基友,是相反的一对操作,所以腐蚀就是求局部最小值的操作,我们一般都会把腐蚀和膨胀对应起来理解和学习。下文就可以看到,两者的函数原型也是基本上一样的。

   原理图:

  

  腐蚀的数学表达式: 

腐蚀效果图(毛笔字):

 

实例演示:

代码如下:

#导入cv模块
import cv2 as cv
import numpy as np

def erode_demo(image):#腐蚀
    print(image.shape)
    gray=cv.cvtColor(image,cv.COLOR_BGR2GRAY)
    ret,binary=cv.threshold(gray,0,255,cv.THRESH_BINARY|cv.THRESH_OTSU)
    cv.imshow("binary image",binary)
    kernel=cv.getStructuringElement(cv.MORPH_RECT,(15,15))#得到结构矩形
    dst=cv.erode(binary,kernel)
    cv.imshow("erode_demo",dst)

def dilate_demo(image):#膨胀
    print(image.shape)
    gray=cv.cvtColor(image,cv.COLOR_BGR2GRAY)
    ret,binary=cv.threshold(gray,0,255,cv.THRESH_BINARY|cv.THRESH_OTSU)
    cv.imshow("binary image",binary)
    kernel=cv.getStructuringElement(cv.MORPH_RECT,(15,15))#得到结构矩形
    dst=cv.dilate(binary,kernel)
    cv.imshow("dilate_demo",dst)

print("------------Python Opencv Tutorial!-------------")
# 读取图像,支持 bmp、jpg、png、tiff 等常用格式
# src = cv.imread("F:/Projects/images/5.png")
src = cv.imread("F:/Projects/images/bin2.png")

#创建窗口并显示图像
cv.namedWindow("input image",cv.WINDOW_AUTOSIZE)
cv.imshow("input image",src)   #显示原图
erode_demo(src)
dilate_demo(src)
cv.waitKey(0)
#释放窗口
cv.destroyAllWindows()

运行效果:

参考链接:https://www.cnblogs.com/wyuzl/p/6262714.html

猜你喜欢

转载自blog.csdn.net/weixin_39036700/article/details/84892469