【opencv-python常用知识速查(二)】

本博客为 【opencv-python常用知识速查(一)】的第二部分,因为如果博客很长,编辑起来特别卡。

4. opencv图像处理(深度学习中常用的)

4.1 改变色彩空间: cv.cvtColor()

cv.cvtColor(img, flag)

img:原图像
flag:要改变的类型

常用的flag有:cv.COLOR_BGR2GRAY (BGR->GRAY)、cv.COLOR_BGR2HSV

img = cv.imread(r'E:\0_postgraduate\test.jpg')
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
cv.imshow('img', img)
cv.imshow('img_gray', gray)
k = cv.waitKey(0)
if k & 0xFF == ord('q'):
    cv.destroyAllWindows()

在这里插入图片描述
我们可以看看flag都有哪些:

flags = [i for i in dir(cv) if i.startswith('COLOR_')]
print( flags )

4.2 改变图像大小:cv.resize()

cv.resize(img, (width, height))
img:原始图像
width:缩放后图像的宽度
height:缩放后图像的高度

img = cv.imread(r'E:\0_postgraduate\test.jpg')
img_resize = cv.resize(img, (500, 600))
cv.imshow('img shape: {} x {}'.format(img.shape[1], img.shape[0]), img)
cv.imshow('img_resize shape: {} x {}'.format(img_resize.shape[1], img_resize.shape[0]), img_resize)
k = cv.waitKey(0)
if k & 0xFF == ord('q'):
    cv.destroyAllWindows()

在这里插入图片描述
比如某些网络要求输入的图像必须是固定大小的:256 x 256这么大的,这时就可以用cv.resize()对大小不一的图像进行缩放。

4.3 二维卷积操作:cv.filter2D()+轨迹条动态控制图像参数:cv.createTrackbar()、cv.getTrackbarPos()

卷积操作是什么这里就不再介绍了。

cv.filter2D(img, -1, kernel)
img:原始图像
-1:这个参数应该是输出图像,没什么用,填-1就行
kernel:卷积核,一个二维数组

而至于cv.createTrackbar()、cv.getTrackbarPos(),这两个函数可以很方便的动态调节图像的参数,很直观地看到调节的效果:

cv.createTrackbar()
第一个参数是轨迹栏名称
第二个参数是它所属的窗口名称,
第三个参数是默认值,
第四个参数是最大值,
第五个参数是执行的回调函数每次轨迹栏值都会发生变化,即每次滑动轨迹条时都会调用该参数。

cv.getTrackbarPos()
第一个参数是滑动条名字,
第二个时所在窗口,
返回值是滑动条的数值

# cv.createTrackbar() 和 cv.getTrackbarPos()测试

def nothing(*arg):
    pass

img = cv.imread(r'E:\0_postgraduate\test.jpg')
img_original = img
cv.namedWindow('image_test')
cv.createTrackbar('kernel_width', 'image_test', 1, 30, nothing)
cv.createTrackbar('kernel_height', 'image_test', 1, 30, nothing)
while 1:
    w = cv.getTrackbarPos('kernel_width', 'image_test')
    h = cv.getTrackbarPos('kernel_height', 'image_test')
    print('w: {} h: {}'.format(w, h))
    if(w!=0 and h!=0):
        kernel = np.ones((w, h), np.float32)/(w*h)
        img = cv.filter2D(img_original, -1, kernel)
        cv.imshow('image_test', img)
    else:
        cv.imshow('image_test', img_original)
    k = cv.waitKey(5)
    if k & 0xFF == ord('q'):
        break
cv.destroyAllWindows()
    

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4.4 常用模糊:平均化模糊:cv.blur()和高斯模糊:cv.GaussianBlur()

(1) cv.blur()
平均化模糊cv.blur()就是让原始图像与一个全1的卷积核做卷积,然后将得到的值除以卷积核中像素的总个数,这么说太绕了,直接上图:

比如我选的卷积核为3x3大小,则原始图像要与如下的卷积核做卷积:
在这里插入图片描述

cv.blur(img, (weight, height))
img:原始图像
weight:卷积核的宽
height:卷积核的长

(2) cv.GaussianBlur()

高斯模糊是在平均化模糊基础上的改进,考虑了距离对于中心像素的影响:与中心像素距离越近的像素拥有越高的权重,其实超级简单,这篇博客说得很清楚了:图像处理:高斯模糊

cv.GaussianBlur(img, (weight, height), sigmaX, sigmaY)
img:原始图像
weight:卷积核的宽
height:卷积核的长
sigmaX:二维高斯函数x的偏差
sigmaY:二维高斯函数y的偏差

注意:
核的宽度和高度,应该是正数和奇数。我们还应该指定X和Y方向的标准偏差,分别为sigmaX和sigmaY。如果只指定sigmaX,sigmaY将被视为与sigmaX相同。如果两者都是零,则根据核大小计算。高斯模糊对去除图像中的高斯噪声非常有效。

img = cv.imread(r'E:\0_postgraduate\test.jpg')
img_blur = cv.blur(img, (5,5))
img_gaussian = cv.GaussianBlur(img, (5,5), 0)
cv.imshow('image_blur', img_blur)
cv.imshow('image_gaussian', img_gaussian)
k = cv.waitKey(0)
if k & 0xFF == ord('q'):
    cv.destroyAllWindows()

在这里插入图片描述

Guess you like

Origin blog.csdn.net/qq_44166630/article/details/121581548