此系列源码在我的GitHub里：https://github.com/yeyujujishou19/Python-OpenCV

一，OpenCV的结构

A）根据功能和需求的不同，OpenCV中的函数接口大体可以分为如下部分：

core	核心模块，主要包含了OpenCV中最基本的结构（矩阵，点线和形状等），以及相关的基础运算/操作。
imgproc	图像处理模块，包含和图像相关的基础功能（滤波，梯度，改变大小等），以及一些衍生的高级功能（图像分割，直方图，形态分析和边缘/直线提取等）。
highgui	提供了用户界面和文件读取的基本函数，比如图像显示窗口的生成和控制，图像/视频文件的IO等。

B）如果不考虑视频应用，以上三个就是最核心和常用的模块了。针对视频和一些特别的视觉应用，OpenCV也提供了强劲的支持：

video：	用于视频分析的常用功能，比如光流法（Optical Flow）和目标跟踪等。
calib3d：	三维重建，立体视觉和相机标定等的相关功能。
features2d：	二维特征相关的功能，主要是一些不受专利保护的，商业友好的特征点检测和匹配等功能，比如ORB特征。
object：	目标检测模块，包含级联分类和Latent SVM
ml：	机器学习算法模块，包含一些视觉中最常用的传统机器学习算法。
flann：	最近邻算法库，Fast Library for Approximate Nearest Neighbors，用于在多维空间进行聚类和检索，经常和关键点匹配搭配使用。
gpu：	包含了一些gpu加速的接口，底层的加速是CUDA实现。
photo：	计算摄像学（Computational Photography）相关的接口，当然这只是个名字，其实只有图像修复和降噪而已。
stitching：	图像拼接模块，有了它可以自己生成全景照片。
nonfree：	受到专利保护的一些算法，其实就是SIFT和SURF。
contrib：	一些实验性质的算法，考虑在未来版本中加入的。
legacy：	字面是遗产，意思就是废弃的一些接口，保留是考虑到向下兼容。
ocl：	利用OpenCL并行加速的一些接口。
superres：	超分辨率模块，其实就是BTV-L1（Biliteral Total Variation – L1 regularization）算法
viz：	基础的3D渲染模块，其实底层就是著名的3D工具包VTK（Visualization Toolkit）。

从使用的角度来看，和OpenCV2相比，OpenCV3的主要变化是更多的功能和更细化的模块划分。

二，opencv基础操作

A）基本绘图

#导入cv模块
import cv2 as cv
import numpy as np

# 可以在画面上绘制线段，圆，矩形和多边形等，还可以在图像上指定位置打印文字

import numpy as np
import cv2

# 定义一块宽1600，高1200的画布，初始化为白色
canvas = np.zeros((400, 600, 3), dtype=np.uint8) + 255   #(400, 600, 3) 宽，高，通道

# 画一条纵向的正中央的黑色分界线
cv2.line(canvas, (300, 0), (300, 399), (0, 0, 0), 2)     #(300, 0) 宽，高

# 画一条右半部份画面以199为界的横向分界线
cv2.line(canvas, (300, 199), (599, 199), (0, 0, 0), 2)   #(300, 0) 宽，高

# 左半部分的右下角画个红色的圆
cv2.circle(canvas, (150, 300), 88, (0, 0, 255), 5)       #(80, 300), 100-》圆心，半径

# 左半部分的左下角画个蓝色的矩形
cv2.rectangle(canvas, (10, 300), (50, 390), (255, 0, 0), thickness=3)  #(10, 10), (60, 60) 左上角坐标, 右下角坐标,

# 定义两个三角形，并执行内部绿色填充
triangles = np.array([
    [(150, 240), (95, 333), (205, 333)],
    [(60, 160), (20, 217), (100, 217)]])
cv2.fillPoly(canvas, triangles, (0, 255, 0))

# 画一个黄色五角星
# 第一步通过旋转角度的办法求出五个顶点
phi = 4 * np.pi / 5
rotations = [[[np.cos(i * phi), -np.sin(i * phi)], [i * np.sin(phi), np.cos(i * phi)]] for i in range(1, 5)]
pentagram = np.array([[[[0, -1]] + [np.dot(m, (0, -1)) for m in rotations]]], dtype=np.float)

# 定义缩放倍数和平移向量把五角星画在左半部分画面的上方
pentagram = np.round(pentagram * 80 + np.array([160, 120])).astype(np.int)

# 将5个顶点作为多边形顶点连线，得到五角星
cv2.polylines(canvas, pentagram, True, (0, 255, 255), 9)


# 按像素为间隔从左至右在画面右半部份的上方画出HSV空间的色调连续变化
for x in range(302, 600):
    color_pixel = np.array([[[round(180*float(x-302)/298), 255, 255]]], dtype=np.uint8)
    line_color = [int(c) for c in cv2.cvtColor(color_pixel, cv2.COLOR_HSV2BGR)[0][0]]
    cv2.line(canvas, (x, 0), (x, 197), line_color)


# 如果定义圆的线宽大于半径，则等效于画圆点，随机在画面右下角的框内生成坐标
np.random.seed(42)
n_pts = 30
pts_x = np.random.randint(310, 590, n_pts)   #x范围
pts_y = np.random.randint(210, 390, n_pts)   #y范围
pts = zip(pts_x, pts_y)

# 画出每个点，颜色随机
for pt in pts:
    pt_color = [int(c) for c in np.random.randint(0, 255, 3)]
    cv2.circle(canvas, pt, 3, pt_color, 5)

# 在左半部分最上方打印文字，按此方法不能显示中文
# cv2.putText(canvas,
#             '打印的文字just english',
#             (5, 15),
#             cv2.FONT_HERSHEY_SIMPLEX,
#             0.5,
#             (0, 0, 0),
#             1)
# cv2.imshow('窗口名称', canvas)
# cv2.waitKey()

# OpenCV-Python在图片上输出中文
# 在Python中，可以借助PIL(Python Imaging Library)模块实现
from PIL import Image, ImageDraw, ImageFont

# 图像从OpenCV格式转换成PIL格式
pil_img = cv2.cvtColor(canvas,cv2.COLOR_BGR2RGB)#cv2和PIL中颜色的hex码的储存顺序不同，需转RGB模式
pilimg = Image.fromarray(pil_img)#Image.fromarray()将数组类型转成图片格式，与np.array()相反
draw = ImageDraw.Draw(pilimg)#PIL图片上打印汉字

#参数1：字体文件路径，参数2：字体大小；Windows系统“simhei.ttf”默认存储在路径：C:\Windows\Fonts中
font = ImageFont.truetype("SIMLI.TTF",30,encoding="utf-8")

draw.text((0,0),"打印的文字 English",(255,0,0),font=font)
cv2img = cv2.cvtColor(np.array(pilimg),cv2.COLOR_RGB2BGR)#将图片转成cv2.imshow()可以显示的数组格式
cv2.imshow("hanzi 汉字",cv2img)  #显示窗口仍然不能显示汉字
cv2.waitKey()
cv2.destroyAllWindows()

代码结果：

B）循环播放图片

#导入cv模块
import time
import cv2
import os
import sys
from itertools import cycle

# =====================OpenCV窗口显示===============================

# img = cv2.imread('D:/test/1.jpg')
# cv2.imshow('窗口标题', img)
# cv2.waitKey()

# =====================OpenCV窗口循环===============================

frame_path="D:/test"  # 图片的文件夹路径

# 列出frames文件夹下的所有图片
filenames = os.listdir(frame_path)

# 通过itertools.cycle生成一个无限循环的迭代器，每次迭代都输出下一张图像对象
img_iter = cycle([cv2.imread(os.sep.join([frame_path, x])) for x in filenames])

key = 0
while key & 0xFF != 27:
    cv2.imshow('window title', next(img_iter))
    key = cv2.waitKey(1000)  #1000为间隔1000毫秒 cv2.waitKey()参数不为零的时候则可以和循环结合产生动态画面

代码结果：

动态显示图片，无法截图了

C）鼠标事件

#导入cv模块
import time
import cv2
import os
import sys
from itertools import cycle

# 定义鼠标事件回调函数
def on_mouse(event, x, y, flags, param):

    # 鼠标左键按下，抬起，双击
    if event == cv2.EVENT_LBUTTONDOWN:
        print('左键按下 ({}, {})'.format(x, y))
    elif event == cv2.EVENT_LBUTTONUP:
        print('左键弹起 ({}, {})'.format(x, y))
    elif event == cv2.EVENT_LBUTTONDBLCLK:
        print('左键双击 ({}, {})'.format(x, y))

    # 鼠标右键按下，抬起，双击
    elif event == cv2.EVENT_RBUTTONDOWN:
        print('右键按下 ({}, {})'.format(x, y))
    elif event == cv2.EVENT_RBUTTONUP:
        print('右键弹起 ({}, {})'.format(x, y))
    elif event == cv2.EVENT_RBUTTONDBLCLK:
        print('右键双击 ({}, {})'.format(x, y))

    # 鼠标中/滚轮键（如果有的话）按下，抬起，双击
    elif event == cv2.EVENT_MBUTTONDOWN:
        print('中间键按下 ({}, {})'.format(x, y))
    elif event == cv2.EVENT_MBUTTONUP:
        print('中间键弹起 ({}, {})'.format(x, y))
    elif event == cv2.EVENT_MBUTTONDBLCLK:
        print('中间键双击 ({}, {})'.format(x, y))

    # 鼠标移动
    elif event == cv2.EVENT_MOUSEMOVE:
        print('移动到 ({}, {})'.format(x, y))

# 为指定的窗口绑定自定义的回调函数
cv2.namedWindow('window title')
img = cv2.imread('D:/2.jpg')
cv2.imshow('window title', img)
cv2.setMouseCallback('window title', on_mouse)  # 第一个参数为要绑定的窗口名称，第二个参数为要绑定的鼠标事件
cv2.waitKey()

代码结果：

D）从带中文的路径中读取图片，并将图片存储到带中文的路径中

#!/usr/bin/env python
# coding: utf-8
import numpy as np
import cv2

#可以读取带中文路径的图
def cv_imread(file_path,type=0):
    cv_img=cv2.imdecode(np.fromfile(file_path,dtype=np.uint8),-1)
    if(type==0):
        if(len(cv_img.shape)==3):
            cv_img = cv2.cvtColor(cv_img, cv2.COLOR_BGR2GRAY)
    return cv_img


readPath="D:/测试/2.jpg"
image=cv_imread(readPath,type=1)

#将图片存储到带中文的路径里
savePath="D:/测试/3.jpg"
cv2.imencode('.jpg', image)[1].tofile(savePath)

代码结果：

Python OpenCV _1基本操作（画图，循环播放图像，鼠标事件，读取中文路径中的图片）

此系列源码在我的GitHub里：https://github.com/yeyujujishou19/Python-OpenCV

一，OpenCV的结构

A）根据功能和需求的不同，OpenCV中的函数接口大体可以分为如下部分：

B）如果不考虑视频应用，以上三个就是最核心和常用的模块了。针对视频和一些特别的视觉应用，OpenCV也提供了强劲的支持：

二，opencv基础操作

A）基本绘图

B）循环播放图片

C）鼠标事件

D）从带中文的路径中读取图片，并将图片存储到带中文的路径中

欢迎扫码关注我的微信公众号

猜你喜欢