我在Vscode学OpenCV 初步接触

OpenCV是一个开源的计算机视觉库，可以处理图像和视频数据。它包含了超过2500个优化过的算法，用于对图像和视频进行处理，包括目标识别、面部识别、运动跟踪、立体视觉等。OpenCV支持多种编程语言，包括C++、Python、Java等，可以在Windows、Linux、Mac OS X、Android等多个平台上使用。

图像

图像和视频数是指数字图像和数字视频中包含的像素或帧数。在数字图像中，图像数指的是图像中包含的像素数量，通常用宽度和高度的乘积来表示。在数字视频中，视频数指的是视频中包含的帧数，即视频中连续的静止图像序列数量。图像和视频数是指数字图像和数字视频中包含的像素或帧数。在数字图像中，图像数指的是图像中包含的像素数量，通常用宽度和高度的乘积来表示。在数字视频中，视频数指的是视频中包含的帧数，即视频中连续的静止图像序列数量。

pip install opencv-contrib-python 直接安装编译好的 OpenCV 贡献库

如果遇到了cv2无法有智能提示的功能

就把你下载cv2的路径下安装包cv2的pyd复制到你现在使用的Python解释器路径的文件下面

一、图像基本操作

导入所需要的库（使用 pip install 完整路径文件名完成安装）

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt

1.0 读取像素

1.0.1 cv2中的方式

1) cv2返回值=图像（位置参数）

# 灰度
p=img[88,142]
print(p)

# 彩色的
b=img[12,13,14]
print(b)
xb=img[12.32]
print(xb)

2) cv2修改像素

img[1,2]=[213,12,12]

#通道的
img[1,2,1]=255

#跨行数的修改
img[100:150,100:150]=[255.0,255]

在这里插入图片描述

1.0.2 np中的方式进行像素处理

第一种方式 x=imgx[1,2] 返回的是一个包含像素值的数组，其中包括了图像的所有通道。而第二种方式 y=imgx.item(1,2) 返回的是指定位置的像素值，对于彩色图像，这个值是该位置的第一个通道的像素值。如果你想获取其他通道的像素值，你需要使用索引来访问。

1）np方式读取像素：返回值=图像.item(位置参数）

y=imgx.item(1,2,1)
print(y)
print(type(y))

在这里插入图片描述

2）修改 itemset((1,2,0),12)

imgx.itemset((1,2,0),12)
print(imgx.item(1,2,0))
print(y)

在这里插入图片描述

1.1 读取图像

 img = cv2.imread(filename, flags=None)

img是返回值，其值是读取到的图像。如果未读取到图像，则返回“None”。
filename 表示要读取的图像的完整文件名。
flags 是读取标记。该标记用来控制读取文件的类型

在这里插入图片描述

1.1.1 演示：

使用的照片：
在这里插入图片描述

# 图像IO操作
import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt

# 1.读取图像

img = cv.imread("Pic/f2e919585490afd1bebd313257e7ad9.jpg")

# 2、显示图像
## 2.1 OpenCV中的方法
cv.imshow("THIS Pi", img)
cv.waitKey(0)
# 按照窗口显示的
cv.destroyAllWindows()

在这里插入图片描述

1.1.2 支持

在这里插入图片描述

1.1.3 flag

在这里插入图片描述

cv2.IMREAD_UNCHANGED和cv2.IMREAD_GRAYSCALE是OpenCV库中用于读取图像的两种不同的模式。

cv2.IMREAD_UNCHANGED：这个模式会读取图像的原始数据，包括alpha通道（如果存在的话）。也就是说，如果图像是彩色的，那么它会保持彩色，如果图像有alpha通道，那么alpha通道也会被保留。
cv2.IMREAD_GRAYSCALE：这个模式会将图像转换为灰度图像。也就是说，无论原始图像是彩色的还是带有alpha通道的，读取后的图像都会是灰度的。加粗样式

- IMREAD_UNCHANGED = -1：返回原始图像，包括alpha通道（如果存在）在内的所有信息，即原始图像。

- IMREAD_GRAYSCALE = 0：将图像转换为灰度图像。

- IMREAD_COLOR = 1：返回BGR顺序的彩色图像,忽略alpha通道。

- IMREAD_ANYDEPTH = 2：如果图像具有深度信息，保留这些信息(，则返回16位/32位图像)，否则将图像转换为8位。

- IMREAD_ANYCOLOR = 4：尝试以最可能的颜色格式读取图像。

- IMREAD_LOAD_GDAL = 8：使用GDAL驱动来读取图像。

- IMREAD_REDUCED_GRAYSCALE_2 = 16, IMREAD_REDUCED_GRAYSCALE_4 = 32, IMREAD_REDUCED_GRAYSCALE_8 = 64：将图像转换为单通道灰度图像，并减少图像的大小（分别减少1/2、1/4、1/8）。

- IMREAD_REDUCED_COLOR_2 = 17, IMREAD_REDUCED_COLOR_4 = 33, IMREAD_REDUCED_COLOR_8 = 65：转换图像为3通道BGR彩色图像，并减少图像的大小（分别减少1/2、1/4、1/8）。

- IMREAD_IGNORE_ORIENTATION = 128：忽略EXIF元数据中的定位信息，不旋转图像。

这些标志可以根据你的需求进行组合使用，例如，你可以同时使用IMREAD_GRAYSCALE和IMREAD_REDUCED_GRAYSCALE_2，这样OpenCV会读取灰度图像，并将其大小减少一半。

部分解释：

1.*.1_ 什么是alpha通道

Alpha通道是图像中的一个通道，它表示图像的透明度信息。在一个RGBA颜色模型中，R代表红色，G代表绿色，B代表蓝色，A代表Alpha，即透明度。
在这里插入图片描述

Alpha通道的值通常在0到255之间，其中0表示完全透明，255表示完全不透明。通过改变Alpha通道的值，我们可以改变图像的透明度。例如，如果我们将一个像素的Alpha值设置为127，那么这个像素将会是半透明的。

Alpha通道在图像处理中有很多应用，例如在合成两个图像时，我们可以通过调整Alpha通道的值来控制每个图像的可见度。

常见的色彩深度有：

1位：二值图像，只有黑和白两种颜色。

8位：灰度图像，可以表示256种不同的灰度级别。

24位：真彩色图像，每个颜色通道（红、绿、蓝）使用8位，可以表示约1670万种颜色。

32位：包含alpha通道的真彩色图像，每个颜色通道（红、绿、蓝和alpha）使用8位。

所以，如果你问的是像素可以表示的颜色数量，那么：

1位色彩深度可以表示2种颜色。

8位色彩深度可以表示256种颜色。

24位色彩深度可以表示约1670万种颜色。

32位色彩深度理论上可以表示约429亿种颜色，但实际上由于alpha通道表示的是透明度而非颜色，所以可表示的颜色数量仍然是约1670万种。

彩色深度标准通常有以下几种：

8位色，每个像素所能显示的彩色数为2的8次方，即256种颜色。

16位增强色，16位彩色，每个像素所能显示的彩色数为2的16次方，即65536种颜色。

24位真彩色，每个像素所能显示的彩色数为24位，即2的24次方，约1680万种颜色。

32位真彩色，即在24位真彩色图像的基础上再增加一个表示图像透明度信息的Alpha通道。

1.*.2_ 灰度图后使用 print 语句打印读取的图像数据。

输出图像的部分像素值

256个灰度等级，255代表全白，0表示全黑。
在这里插入图片描述
灰度图的显示的print

原格式的print

1.2 显示图像

在读取图像前判断图像文件是否存在，并在显示图像前判断图像是否存在

1.2.1 imshow函数__在一个窗口内显示读取的图像。

img = cv2.imshow( winname, mat )

winname 是窗口名称、mat 是要显示的图像。

cv2.imshow("THIS Pi", img)
cv2.imshow("THIS Pi", img)

如果是两个同名的，只会显示一个窗口

cv2.namedWindow("lesson")
cv2.imshow("THIS Pi", img)
cv2.imshow("lesson", img)  引用一个并不存在的窗口，并在其中显示指定图像

可以用cv2.imshow()来创建一个新窗口并显示图像。如果指定的窗口名称已存在，则会在该窗口中显示图像。如果指定的窗口名称不存在，则会创建一个新的窗口并显示图像。实际上，cv2.imshow()函数会完成窗口的创建和图像的显示两个步骤。

1.2.2 namedWindow__创建指定名称的窗口

 img = cv2.namedWindow( winname )

1.2.3 waitKey函数

cv2.waitKey( [delay] )

retval表示函数cv2.waitKey()的返回值。如果没有按键被按下，则返回-1；如果有按键被按下，则返回该按键的ASCII码。

delay表示等待键盘触发的时间，单位是毫秒。当该值设置为负数或零时，表示无限等待，即函数会一直等待键盘的触发。该值默认为0。

1.2.3.1 要实现交互，可以使用cv2.waitKey函数来等待键盘输入

import cv2

# 读取图像
image = cv2.imread("image.jpg")

while True:
    # 在窗口中显示图像
    cv2.imshow("Image", image)

    # 等待键盘输入，等待时间为0毫秒
    key = cv2.waitKey(0)

    # 如果按下键盘上的 "q" 键，退出循环
    if key == ord("q"):
        break

# 关闭窗口
cv2.destroyAllWindows()

delay>0 等待delay毫秒
delay<0 等待键盘单击
delay=0 无限等待

窗口会显示读取的图像，然后等待键盘输入。如果按下的是 “q” 键，程序将退出循环并关闭窗口。如果按下其他键，则会继续等待键盘输入。这样就实现了交互式地显示图像。

1.2.4 destroyWindow函数

cv2.destroyWindow( winname #winname 是窗口的名称。

1.2.5 destroyAllWindows

 cv2.destroyAllWindows()#用来释放（销毁）所有窗口

在这里插入图片描述

1.3 保存图像 cv2.imwrite()

retval cv2.imwrite( filename, img[, params] )#文件地址，文件名

retval 是返回值。如果保存成功，则返回 True；如果保存不成功，则返回 False。

filename 是要保存的目标文件的完整路径名，包含文件扩展名。

img 是被保存的图像。

params 是保存类型参数，是可选的

import cv2

# 读取图像
image = cv2.imread("image.jpg")

# 保存图像
retval = cv2.imwrite("saved_image.jpg", image)

# 判断是否保存成功
if retval:
    print("图像保存成功")
else:
    print("图像保存失败")

在这里插入图片描述
保存灰度图
对比一下先：

plt.imshow(img,cmap=plt.cm.gray)
在这里插入图片描述
为了直观用Pycharm

二、绘制几何图形

import numpy as np
import cv2

# 创建一个黑色的图像
img = np.zeros((512, 512, 3), dtype=np.uint8)

# 画线
cv2.line(img, (0, 0), (511, 511), (255, 0, 0), 5)

# 画矩形
cv2.rectangle(img, (384, 0), (510, 128), (0, 255, 0), 3)

# 画圆
cv2.circle(img, (447, 63), 63, (0, 0, 255), -1)

# 画椭圆
cv2.ellipse(img, (256, 256), (100, 50), 0, 0, 180, 255, -1)

# 画多边形
pts = np.array([[10, 5], [20, 30], [70, 20], [50, 10]], np.int32)
pts = pts.reshape((-1, 1, 2))
cv2.polylines(img, [pts], True, (0, 255, 255))

# 显示图像
cv2.imshow('Image with Shapes', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

2.1 画直线

def line(img, pt1, pt2, color, thickness=None, lineType=None, shift=None):

在这里插入图片描述

2.2 画矩形

def rectangle(img, pt1, pt2, color, thickness=None, lineType=None, shift=None):

在这里插入图片描述

2.3 画圆

def circle(img, center, radius, color, thickness=None, lineType=None, shift=None):

在这里插入图片描述

2.4 画椭圆

def ellipse(img, center, axes, angle, startAngle, endAngle, color, thickness=None, lineType=None, shift=None)