1. 画像や動画の読み込みと表示
私もOpenCVの初心者で、Pythonの基礎もあまり良くないので(以前Javaを習っていたので)、初回の内容は比較的基本的なものです。
もちろんOpenCVの環境は事前に準備しておく必要がありますが、B局のOpenCVの動画で大体紹介されているのでここでは割愛します。
1.1 ウィンドウの作成とウィンドウの表示
一般的に使用される API:
(関数は基本的に C++ の命名規則、hump 構造です)
- cv2.namedWindow(winname[, flags]): 名前付きウィンドウを作成する
- cv2.imshow(winname,mat): 表示ウィンドウ
- cv2.destroyAllWindows(): すべてのウィンドウを破棄します
- cv2.resizeWindow(winname, width, height): ウィンドウのサイズを変更します
- cv2.waitKey([, delay]): ユーザー入力を待つ
#虽然OpenCV名字叫这个,但是初始时候叫做cv2,便一直沿用至今
import cv2
#创建窗口,winname为你命名的窗口名称,中括号里面的表示可以不写,系统会给默认值
#这里说明两个选择:
#1.cv2.WINDOW_NORMAL :你可以改变你的窗口大小
#2.cv2.WINDOW_AUTOSIZE:系统自动地把窗口大小设置成你图片的大小
#不写就默认第二种
cv2.namedWindow('window')
#更改窗口大小,注意想要更改窗口大小需要为第一种flag
cv2.namedWindow('window', cv2.WINDOW_NORMAL)
cv2.resizeWindow('window', 800, 600)
#展示名字为window的窗口
cv2.imshow('window', 0)
#等待按键,括号内为等待时间,毫秒级,0表示任意键终止,会返回按键的ASCII值
#计算字母的ASCII值
#ord('q')
cv2.waitKey(0)
#可以使用waitKey来销毁窗口
key = cv2.waitKey(0)
#& 0xFF非必要,完全可以不写,key是int型,最少是16位,而ASCII码是8位
if key & 0xFF == ord('q'):
cv2.destroyAllWindows()
1.2 表示画像の読み込み
- cv2.imread(filename[, flags]): 画像を読み取り、デフォルトでカラー画像を読み取ります
OpenCV によって読み取られる画像のカラー チャネルは BGR であることに注意してください - 一般的に使用される 3 つのフラグがあります。
- cv2.IMREAD_COLOR: アルファチャンネルを無視したカラー画像
- cv2.IMREAD_GRAYSCALE: グレースケール画像
- cv2.IMREAD_UNCHANGED: アルファチャンネルを含む全体像を読み込みます
import cv2
import matplotlib.pyplot as plt
import numpy as np
#读取图片,绝对路径和相对路径都可以,flags后文再提
img = cv2.imread('./img.jpg')
#matplotlib显示图片,但我们会发现matplotilb显示的颜色和真实图片不一样,因为OpenCV读进来的图片数据的颜色通道不是默认的RGB,而是BGR(蓝绿红),所以一般用OpenCV自己的方式展示图片
plt.imshow(img)
cv2.imshow('img', img)
1.3 画像を保存する
- cv2.imwrite(ファイル名, img[, パラメータ])
import cv2
#其实正常完全可以省去这两步,但是为了联系上面的只是还是写一下 吧
cv2.namedWindow('img', cv2.WINDOW_NORMAL)
cv2.resizeWindow('img', 320, 240)
img = cv2.imread('./img.jpg')
#利用while循环优化退出逻辑
while True:
cv2.imshow('img', img)
key = cv2.waitKey(0)
if(key & 0xFF == ord('q')):
break
elif(key & 0xFF == ord('s'):
#是可以对你想保存的图片进行重命名和改变图片格式
cv2.imwrite("./img2.png", img)
elif:
print(key)
cv2.destrpyAllWindows()
1.4 ビデオキャプチャ
- ビデオは画像で構成されており、ビデオの各フレームは通常 30 フレームの画像であり、1 秒間に 30 枚の画像が表示されることを意味します。
- cv2.VideoCapture(): カメラをキャプチャし、数字を使用して 0、1 などのさまざまなデバイスを表すことができます
- 注: ここの VideoCapture はクラスなので、最初の文字は大文字です
- 動画ファイルの場合はパスを直接指定するだけ
#打开视频文件
vc = cv2.VideoCapture('./1.mp4')
#打开摄像头,如果打开失败,不会报错,看起来是闪退
vc = cv2.VideoCapture(0)
- 正しく開いているか確認する
if vc.isOpened():
#读取视频的一帧,返回标记和这一帧数据,open为True表示读到了数据,为false表示没读到数据
open, frame = vc.read()
else:
open = False
- ループしてビデオ データの各フレームを読み取ります
while True:
#可以读到内容ret返回True
ret, frame = vc.read()
if not ret:
#没读到数据,直接退出
break
#显示数据
cv2.imshow('video', frame)
#假如一个视频是30帧,我们每张图间要间隔1000//30秒,注意必须是整数
key = cv2.waitKey(1000//30)
if key == ord('q'):
break
#释放资源
vc.release()
cv2.destroyAllWindows()
1.5 ビデオ録画
- cv2.VIdeoWriter(): 最初のパラメーターは出力ファイル、2 番目のパラメーターはマルチメディア ファイル形式 (VideoWriter_fourcc)、3 番目のパラメーターはフレーム レート、4 番目のパラメーターは解像度です。
- write: エンコードしてキャッシュに書き込みます
- release: キャッシュの内容がディスクに書き込まれ、リソースが解放されます
cap = cv2.VideoCapture(0)
#*mp4v就是解包操作,等同于 'm', 'p', '4', 'v'
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
#(640, 480)表示摄像头拍视频,这个大小不能错
#主要是这个分辨率
vm = cv2.VideoWriter('output.mp4', fourcc, 20, (640, 480))
while cap.isOpened():
ret, frame = cap.read()
if not ret:
break
vm.write(frame)
cv2.imshow('frame', frame)
if cv2.waitKey(10) == ord('q'):
break
cap.release()
#释放VideoWriter
vm.release()
cv2.destroyAllWindows()
よし、まずはここで前編を終わらせよう(PCの画面を見つめるのが面倒すぎる=.=)。