白话文讲计算机视觉-第三讲-滤波器

我们今天来学习第三讲,第三讲我们主要讲解的是滤波器。滤波器听着名字倒是挺TMD高大上,但是呢,名字叫的NB不一定就真NB。比如X门大学的XX良,又是奖学金获得者,又是保研保博的人,但是她的智商捉急啊。真正的坏人都找不到,却侮辱我们中国的普通人,还说自己的母校是野鸡大学。对于这个

名字NB的XX良的评价我就到这里了,点到为止,我还是说一下什么叫做滤波器,滤波器名字顾名思义,就是能够把原始数据过滤掉一部分的一种机器。

比如有一张图:

 

这是一个123*176的灰度图片,也就是说它共有123*176=21648个点,这些点组成了一个点阵:其中点阵有123行,每行中包含176个点,而这些点的亮度不同,如果白色为255,黑色为0.灰度图的每一个点的亮度在0~255之间,也就是黑白之间,这样就是灰色,也就是灰度。如果大家想不明白,你就想一共有21648个小灯泡,全亮是白色,不亮是黑色,要是在全亮和不亮之间调节光的强度,就是一堆过渡颜色。

如果把这张图加上颜色的话,也就是我们在每一个点中放三个灯泡,这三个灯叫做BGR,也就是blue,green,red,三原色,根据三个小灯泡的亮度不同,就会组成N种颜色。因为是三个小灯牌,所以说由123*176的灰度图片变成了123*176*3的彩色图片,3中每一个123*176的点阵数据代表一个小灯泡的数值,也是0~255之间,比如B灯,0是黑色,255是蓝色。

说完图片了,我们用滤波器怎么过滤呢?我们以黑白图片举例,让大家看看滤波器的样子:


A、B就是两个滤波器,这样的滤波器也叫做高通滤波器,高通低通我后面会介绍。现在我们说一下A、B,A叫做3*3核滤波器、B叫做5*5核滤波器。这些滤波器和图片的点阵做卷积,得到的新的矩阵就是过滤后的图像。

举一个例子:

如果我们有一张4*4的图片,我们要通过一个3*3的滤波器过滤,那么怎么做呢?

(1)我们假定3*3的滤波器为:


图像点阵为:


我们首先在矩阵的外围加0,添加一圈,变成这样:


为什么是添加一圈而不是两圈,这是因为我们的滤波器是3*3的,我们让最中间的元素,也就是第二行第二列的元素,对着图像的第一个元素。然后我们发现左边少了一列,上面少了一行,同理用中间元素对着图像中第一行最后一个、最后一行第一个、最后一行最后一个,我们就会发现要添加的是一圈的0。添加完成之后,我们下一步要做的就是做卷积。怎么做?

(2)我们首先把滤波器旋转180度:

3)然后用旋转后的滤波器中间元素对准图片的第一个元素(未加0之前),然后把图像点阵中和滤波器对应位置的值相乘,然后相加。比如第一次滤波器与图像卷积的是:


那么我们用其与滤波器相乘:0*0+0*0+0*1+0*0+1*1+2*1+0*1+5*1+3*1=11。

4)接下来我们把滤波器往右移动一格,滤波器对应的元素变为:


我们用其与滤波器相乘:0*0+0*0+0*1+1*0+2*1+0*1+5*1+3*1+0*1=10。

5)同理我们继续移动,直到第一行最后一格元素0被卷积计算完毕为止。这样我们得到了4个数据,我们给它拼成一行:[11,10,7,4]

6)然后我们回到这行最开始的位置,也就是1那个位置,然后向下移动一格:


7)然后进行卷积运算,得到新的元素为10.同理向右移动到最后一个位置,卷积后返回第二行开头,向下移动一位。以此类推直到所有的数据都被滤波器遍历到为止。我们最终得到一个新的、滤波完毕的矩阵:


8)得到这个矩阵之后,我们的滤波就完成了,这个矩阵就是滤波后得到的新的图像啦。

我们在OPENCV中怎么让它实现呢,很简单,程序如下:

import cv2

import numpy as np

from scipy import ndimage

a = np.array([[1, 2, 0, 0],

    [5, 3, 0, 4],

    [0, 0, 0, 7],

    [9, 3, 0, 0]])

k = np.array([[1,1,1],

[1,1,0],

[1,0,0]])

aa=ndimage.convolve(a, k, output=None, mode='constant', cval=0.0, origin=0)

首先我们定义了一个4*4的矩阵(图像),这时为了方便教学小木我用矩阵来假设一章图片,而不是真正图片。然后定义了一个3*3的滤波器。接着用ndimage.convolve()这个方法求出aa矩阵,也就是就是卷积后的矩阵(图像)。我来说一下里面的参数吧,参数a,k分别指的是原始图片,图片滤波器。output指的是输出,我们用aa输出了,就写none好了,也就是不输出。mode是模式,模式有很多种: {‘reflect’,’constant’,’nearest’,’mirror’, ‘wrap’},reflect是不添加0,而是把一边末尾的元素搬到另一边(镜像,比如左边的添加0改成把右边最后一行挪到左边),如果我们不指定是哪个,那么默认的是reflect。我们上面讲的是constant模式,也就是常量模式,所以写constant就好了。cval指的是我们在外围加什么数字,上面的例子是加0,那么就写0。origin是过滤器的位置偏移我们所选的元素中心多少,一般我们不偏移,所以写0就行,如果写其他数字,比如1,就是往左边和上面都偏移一格。

这样滤波器的原理就讲完了,接下来我说一下滤波器的种类:

滤波器按照大类来分的话有两种,一种叫做高通滤波器,另外一种叫做低通滤波器。高通滤波器我们上面已经看过几个例子了:


A和B就是高通滤波器,我们就拿A举例来说明,我们看A里面我们就会发现,A里面一共九个元素,而且这九个元素相加等于0。我们再往深里面想,我们滤波的时候,每一次卷积时候,图片的点阵对应的元素是滤波器的8,如果我们是在过滤图片的第一个元素的话,那么第一个元素乘以8,第一个元素旁边的元素就是乘以-1,然后加和。我们看看这次的加和,就是第一个元素的八倍与周围的8个元素相减。如果说图片中间的元素的值与周围的值相差很大,那么我们过滤之后,与之前原图片的值相差会很大,也就是亮度增加了,反之亮度不会增加。简单的例子是如果这个点是100,其它点都是100的话,那么结果就是0,也就是白色变成了黑色,亮度没有增加。如果点是100,其它的都是10,那么我们算出来就是720,我们的最大值是255,所以取255,这个点就是白点,高亮显示。我们把所有的点都这样之后,突出的点就会亮度变大,不突出的亮度减少。我们知道一个东西最外边缘和背景肯定值相差很大,所以这样可以提取出图片的边缘。我们写一个程序,来获取过滤前后的图片:

#导入相关的库

import cv2

import numpy as np

from scipy import ndimage

#定义一个3*3高通滤波器

kernel_3=np.array([[-1,-1,-1],

                  [-1, 8,-1],

                  [-1,-1,-1]])

#定义一个5*5高通滤波器

kernel_5=np.array([[-1,-1,-1,-1,-1],

                   [-1,-1, 2,-1,-1],

                   [-1, 2, 4, 2,-1],

                   [-1,-1, 2,-1,-1],

                   [-1,-1,-1,-1,-1]])

#导入图片

img=cv2.imread('D:/xiaomu/opencv1-1.png',0)

#显示图片

cv2.imshow('dawawa',img)

#高通滤波

k3=ndimage.filters.convolve(img,kernel_3)

k5=ndimage.filters.convolve(img,kernel_5)

#显示高通滤波后图片

cv2.imshow('dawawaK3',k3)

cv2.imshow('dawawaK5',k5)

#等待键盘按键

cv2.waitKey()

#关闭窗口并退出

cv2.destroyAllWindows()

我们发现5*5的滤波器可以很明显地把物体的轮廓从背景中描绘出来。


高通滤波器我们知道它们可以用于边缘勾画,那么低通滤波器呢?低通滤波器干的事儿是去噪声和模糊化。噪声是什么?就是我们这个图片不清晰,上面有很多的黑、白点。我们通过低通滤波器模糊化,把小黑、白点给去掉。低通滤波器一般有如下形式:


这就是一个低通滤波器,我们发现这个滤波器是一个5*5的核,然后所有值相加等于1。这说明啥呢,如果我们图像中的某一个像素点和周围像素点的差值大的话,那么这个点就会被周围的像素给 同化。比如中间值是8,其他地方都是4,那么经过卷积之后这个值就变成了4.16,和4好近哦。这样不就是同化了么,如果我们按照极端的情况想的话,8就相当于白点,一下子就没了,也就是模糊化来了。

我们写一个程序试试:

#导入相关的库

import cv2

import numpy as np

from scipy import ndimage

 

#定义一个5*5低通滤波器

kernel_5=np.array([[0.04,0.04,0.04,0.04,0.04],

                   [0.04,0.04,0.04,0.04,0.04],

                   [0.04,0.04,0.04,0.04,0.04],

                   [0.04,0.04,0.04,0.04,0.04],

                   [0.04,0.04,0.04,0.04,0.04]])

#导入图片

img=cv2.imread('D:/xiaomu/opencv1-1.png',0)

#显示图片

cv2.imshow('dawawa',img)

#低通滤波

k5=ndimage.filters.convolve(img,kernel_5)

#显示高通滤波后图片

cv2.imshow('dawawaK5',k5)

#等待键盘按键

cv2.waitKey()

#关闭窗口并退出

cv2.destroyAllWindows()


虽然变模糊了,但是效果感觉并不是很好呀?这个是因为滤波器的局限性。有此我们引出了腐蚀膨胀的概念,我们可以通过开运算来去毛刺,闭运算去噪,先开后闭两个都用来更好的去除噪声。本来这节课想讲腐蚀膨胀,可是篇幅太长,下节课再讲吧。

———————————————

如果对我的课程感兴趣的话,欢迎关注小木希望学园-微信公众号: 

mutianwei521

也可以扫描二维码哦!


猜你喜欢

转载自blog.csdn.net/u013631121/article/details/80444602