我在Vscode学OpenCV 初步接触

OpenCV是一个开源的计算机视觉库,可以处理图像和视频数据。它包含了超过2500个优化过的算法,用于对图像和视频进行处理,包括目标识别、面部识别、运动跟踪、立体视觉等。OpenCV支持多种编程语言,包括C++、Python、Java等,可以在Windows、Linux、Mac OS X、Android等多个平台上使用。

图像

图像和视频数是指数字图像和数字视频中包含的像素或帧数。在数字图像中,图像数指的是图像中包含的像素数量,通常用宽度和高度的乘积来表示。在数字视频中,视频数指的是视频中包含的帧数,即视频中连续的静止图像序列数量。图像和视频数是指数字图像和数字视频中包含的像素或帧数。在数字图像中,图像数指的是图像中包含的像素数量,通常用宽度和高度的乘积来表示。在数字视频中,视频数指的是视频中包含的帧数,即视频中连续的静止图像序列数量。


pip install opencv-contrib-python 直接安装编译好的 OpenCV 贡献库

如果遇到了cv2无法有智能提示的功能

就把你下载cv2的路径下安装包cv2的pyd复制到你现在使用的Python解释器路径的文件下面

一、图像基本操作

导入所需要的库(使用 pip install 完整路径文件名完成安装)

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt

1.0 读取像素

1.0.1 cv2中的方式

1) cv2返回值=图像(位置参数)
# 灰度
p=img[88,142]
print(p)

# 彩色的
b=img[12,13,14]
print(b)
xb=img[12.32]
print(xb)
2) cv2修改像素
img[1,2]=[213,12,12]

#通道的
img[1,2,1]=255

#跨行数的修改
img[100:150,100:150]=[255.0,255]

在这里插入图片描述

1.0.2 np中的方式进行像素处理

第一种方式 x=imgx[1,2] 返回的是一个包含像素值的数组,其中包括了图像的所有通道。而第二种方式 y=imgx.item(1,2) 返回的是指定位置的像素值,对于彩色图像,这个值是该位置的第一个通道的像素值。如果你想获取其他通道的像素值,你需要使用索引来访问。

1)np方式读取像素 :返回值=图像.item(位置参数)
y=imgx.item(1,2,1)
print(y)
print(type(y))

在这里插入图片描述

2)修改 itemset((1,2,0),12)
imgx.itemset((1,2,0),12)
print(imgx.item(1,2,0))
print(y)

在这里插入图片描述

1.1 读取图像

 img = cv2.imread(filename, flags=None)
  • img是返回值,其值是读取到的图像。如果未读取到图像,则返回“None”。
  • filename 表示要读取的图像的完整文件名。
  • flags 是读取标记。该标记用来控制读取文件的类型

在这里插入图片描述

1.1.1 演示:

使用的照片:
在这里插入图片描述

# 图像IO操作
import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt

# 1.读取图像

img = cv.imread("Pic/f2e919585490afd1bebd313257e7ad9.jpg")

# 2、显示图像
## 2.1 OpenCV中的方法
cv.imshow("THIS Pi", img)
cv.waitKey(0)
# 按照窗口显示的
cv.destroyAllWindows()

在这里插入图片描述

1.1.2 支持

在这里插入图片描述

在这里插入图片描述

1.1.3 flag

在这里插入图片描述
在这里插入图片描述
cv2.IMREAD_UNCHANGED和cv2.IMREAD_GRAYSCALE是OpenCV库中用于读取图像的两种不同的模式。

  • cv2.IMREAD_UNCHANGED:这个模式会读取图像的原始数据,包括alpha通道(如果存在的话)。也就是说,如果图像是彩色的,那么它会保持彩色,如果图像有alpha通道,那么alpha通道也会被保留。

  • cv2.IMREAD_GRAYSCALE:这个模式会将图像转换为灰度图像。也就是说,无论原始图像是彩色的还是带有alpha通道的,读取后的图像都会是灰度的。加粗样式

- IMREAD_UNCHANGED = -1:返回原始图像,包括alpha通道(如果存在)在内的所有信息,即原始图像。

- IMREAD_GRAYSCALE = 0:将图像转换为灰度图像。

- IMREAD_COLOR = 1:返回BGR顺序的彩色图像,忽略alpha通道。

- IMREAD_ANYDEPTH = 2:如果图像具有深度信息,保留这些信息(,则返回16/32位图像),否则将图像转换为8位。

- IMREAD_ANYCOLOR = 4:尝试以最可能的颜色格式读取图像。

- IMREAD_LOAD_GDAL = 8:使用GDAL驱动来读取图像。

- IMREAD_REDUCED_GRAYSCALE_2 = 16, IMREAD_REDUCED_GRAYSCALE_4 = 32, IMREAD_REDUCED_GRAYSCALE_8 = 64:将图像转换为单通道灰度图像,并减少图像的大小(分别减少1/21/41/8)。

- IMREAD_REDUCED_COLOR_2 = 17, IMREAD_REDUCED_COLOR_4 = 33, IMREAD_REDUCED_COLOR_8 = 65:转换图像为3通道BGR彩色图像,并减少图像的大小(分别减少1/21/41/8)。

- IMREAD_IGNORE_ORIENTATION = 128:忽略EXIF元数据中的定位信息,不旋转图像。

这些标志可以根据你的需求进行组合使用,例如,你可以同时使用IMREAD_GRAYSCALE和IMREAD_REDUCED_GRAYSCALE_2,这样OpenCV会读取灰度图像,并将其大小减少一半。
部分解释:
1.*.1_ 什么是alpha通道

Alpha通道是图像中的一个通道,它表示图像的透明度信息。在一个RGBA颜色模型中,R代表红色,G代表绿色,B代表蓝色,A代表Alpha,即透明度。
在这里插入图片描述

Alpha通道的值通常在0到255之间,其中0表示完全透明,255表示完全不透明。通过改变Alpha通道的值,我们可以改变图像的透明度。例如,如果我们将一个像素的Alpha值设置为127,那么这个像素将会是半透明的。

Alpha通道在图像处理中有很多应用,例如在合成两个图像时,我们可以通过调整Alpha通道的值来控制每个图像的可见度。

常见的色彩深度有:

  • 1位:二值图像,只有黑和白两种颜色。
  • 8位:灰度图像,可以表示256种不同的灰度级别。
  • 24位:真彩色图像,每个颜色通道(红、绿、蓝)使用8位,可以表示约1670万种颜色。
  • 32位:包含alpha通道的真彩色图像,每个颜色通道(红、绿、蓝和alpha)使用8位。

所以,如果你问的是像素可以表示的颜色数量,那么:

  • 1位色彩深度可以表示2种颜色。
  • 8位色彩深度可以表示256种颜色。
  • 24位色彩深度可以表示约1670万种颜色。
  • 32位色彩深度理论上可以表示约429亿种颜色,但实际上由于alpha通道表示的是透明度而非颜色,所以可表示的颜色数量仍然是约1670万种。

彩色深度标准通常有以下几种:

  • 8位色,每个像素所能显示的彩色数为2的8次方,即256种颜色。
  • 16位增强色,16位彩色,每个像素所能显示的彩色数为2的16次方,即65536种颜色。
  • 24位真彩色,每个像素所能显示的彩色数为24位,即2的24次方,约1680万种颜色。
  • 32位真彩色,即在24位真彩色图像的基础上再增加一个表示图像透明度信息的Alpha通道。
1.*.2_ 灰度图后使用 print 语句打印读取的图像数据。

输出图像的部分像素值

256个灰度等级,255代表全白,0表示全黑。
在这里插入图片描述
灰度图的显示的print
在这里插入图片描述
原格式的print
在这里插入图片描述

1.2 显示图像

在读取图像前判断图像文件是否存在,并在显示图像前判断图像是否存在

1.2.1 imshow函数__在一个窗口内显示读取的图像。

img = cv2.imshow( winname, mat )

winname 是窗口名称、mat 是要显示的图像。

cv2.imshow("THIS Pi", img)
cv2.imshow("THIS Pi", img)

如果是两个同名的,只会显示一个窗口

cv2.namedWindow("lesson")
cv2.imshow("THIS Pi", img)
cv2.imshow("lesson", img)  引用一个并不存在的窗口,并在其中显示指定图像

可以用cv2.imshow()来创建一个新窗口并显示图像。如果指定的窗口名称已存在,则会在该窗口中显示图像。如果指定的窗口名称不存在,则会创建一个新的窗口并显示图像。实际上,cv2.imshow()函数会完成窗口的创建和图像的显示两个步骤。

1.2.2 namedWindow__创建指定名称的窗口

 img = cv2.namedWindow( winname )

1.2.3 waitKey函数

cv2.waitKey( [delay] )

retval表示函数cv2.waitKey()的返回值。如果没有按键被按下,则返回-1;如果有按键被按下,则返回该按键的ASCII码。

delay表示等待键盘触发的时间,单位是毫秒。当该值设置为负数或零时,表示无限等待,即函数会一直等待键盘的触发。该值默认为0。
在这里插入图片描述

1.2.3.1 要实现交互,可以使用cv2.waitKey函数来等待键盘输入
import cv2

# 读取图像
image = cv2.imread("image.jpg")

while True:
    # 在窗口中显示图像
    cv2.imshow("Image", image)

    # 等待键盘输入,等待时间为0毫秒
    key = cv2.waitKey(0)

    # 如果按下键盘上的 "q" 键,退出循环
    if key == ord("q"):
        break

# 关闭窗口
cv2.destroyAllWindows()

delay>0 等待delay毫秒
delay<0 等待键盘单击
delay=0 无限等待

窗口会显示读取的图像,然后等待键盘输入。如果按下的是 “q” 键,程序将退出循环并关闭窗口。如果按下其他键,则会继续等待键盘输入。这样就实现了交互式地显示图像。

1.2.4 destroyWindow函数

cv2.destroyWindow( winname #winname 是窗口的名称。

1.2.5 destroyAllWindows

 cv2.destroyAllWindows()#用来释放(销毁)所有窗口

在这里插入图片描述

1.3 保存图像 cv2.imwrite()

retval cv2.imwrite( filename, img[, params] )#文件地址,文件名

retval 是返回值。如果保存成功,则返回 True;如果保存不成功,则返回 False。

filename 是要保存的目标文件的完整路径名,包含文件扩展名。

img 是被保存的图像。

params 是保存类型参数,是可选的

import cv2

# 读取图像
image = cv2.imread("image.jpg")

# 保存图像
retval = cv2.imwrite("saved_image.jpg", image)

# 判断是否保存成功
if retval:
    print("图像保存成功")
else:
    print("图像保存失败")

在这里插入图片描述
保存灰度图
对比一下先:
在这里插入图片描述

plt.imshow(img,cmap=plt.cm.gray)
在这里插入图片描述
为了直观用Pycharm
在这里插入图片描述

二、绘制几何图形

import numpy as np
import cv2

# 创建一个黑色的图像
img = np.zeros((512, 512, 3), dtype=np.uint8)

# 画线
cv2.line(img, (0, 0), (511, 511), (255, 0, 0), 5)

# 画矩形
cv2.rectangle(img, (384, 0), (510, 128), (0, 255, 0), 3)

# 画圆
cv2.circle(img, (447, 63), 63, (0, 0, 255), -1)

# 画椭圆
cv2.ellipse(img, (256, 256), (100, 50), 0, 0, 180, 255, -1)

# 画多边形
pts = np.array([[10, 5], [20, 30], [70, 20], [50, 10]], np.int32)
pts = pts.reshape((-1, 1, 2))
cv2.polylines(img, [pts], True, (0, 255, 255))

# 显示图像
cv2.imshow('Image with Shapes', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

2.1 画直线

def line(img, pt1, pt2, color, thickness=None, lineType=None, shift=None):

在这里插入图片描述

2.2 画矩形

def rectangle(img, pt1, pt2, color, thickness=None, lineType=None, shift=None): 

在这里插入图片描述

2.3 画圆

def circle(img, center, radius, color, thickness=None, lineType=None, shift=None): 

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.4 画椭圆

def ellipse(img, center, axes, angle, startAngle, endAngle, color, thickness=None, lineType=None, shift=None)

2.5 画多边形

猜你喜欢

转载自blog.csdn.net/m0_74154295/article/details/131445168