前言
使用libfacedetection库,我们能对一张图像进行人脸识别,那我们能否对多张图像进行识别呢,那就是接下来要说的,对一段视频进行人脸识别。
一、libfacedetection的配置及基本介绍:
这篇文章中我们进行了详细的介绍:https://blog.csdn.net/ivan_9/article/details/113336452
二、VideoCapture类:
1、构造函数类型:
2.1.1、VideoCapture();
简介:VideoCapture();是VideoCapture类的默认构造函数;
2.1.2、VideoCapture(const String& filename, int apiPreference = CAP_ANY);
简析:打开视频文件或捕获设备或IP视频流,以便使用API首选项进行视频捕获
filename此参数可以是:
- 视频文件的名称(例如
视频.avi
) - 图像序列(例如“img\uu02d.jpg”,它将读取“img\u 00.jpg,img\u 01.jpg,img\u 02.jpg,…”)
- 视频流的URL(例如
协议://主机:端口/脚本名称?脚本|参数| auth
) - gst启动工具格式的GStreamer管道字符串,以防GStreamer用作后端,每个视频流或IP摄像机feed都有自己的URL方案
- 首选要使用的捕获API后端。可用于强制特定读取器
2.1.3、VideoCapture(int index, int apiPreference = CAP_ANY);
简析:打开摄像头进行视频捕获
- 要打开的视频捕获设备的参数索引id。
- 使用默认后端打开默认相机,只需传递0。其他外接的摄像头或其他相机,传递1即可。
- apippreference首选要使用的捕获API后端。可用于强制特定读取器
- 如果有多个可用的实现:例如e.g. cv::CAP_DSHOW or cv::CAP_MSMF or cv::CAP_V4L.
2、构造函数具体定义:
class CV_EXPORTS_W VideoCapture{
public:
CV_WRAP VideoCapture();
CV_WRAP explicit VideoCapture(const String& filename, int apiPreference = CAP_ANY)
CV_WRAP explicit VideoCapture(int index, int apiPreference = CAP_ANY);
}
三、VideoCapture类的函数:
1、open();函数
简介:打开用于视频捕获的视频文件、捕获设备或IP视频流。
3.1.1、第一种使用:
VideoCapture capture;
captrue.open("有趣的灵魂.mp4");//可以是avi,可以是mp4格式的视频文件
3.1.2、第二种使用:
VideoCapture capture("有趣的灵魂.mp4");//利用构造函数直接获取
2、isOpened()函数:
简析:如果已初始化视频捕获,则返回true,判断是否读取成功
if (cap.isOpened()) {
cout << "恭喜你打开视频文件了!" << endl;
}
else {
cout << "对不起你没打开视频文件!" << endl;
return -1;
}
3、release()函数:
简析:关闭视频文件或捕获设备,与open()函数是相对应的,最好不要漏了release()函数
VideoCapture capture;
captrue.open("有趣的灵魂.mp4");
cap.release();
4、grab()函数与retrieve()函数:
简析:grab()函数从视频文件或照相机中获取下一帧,并返回true(成功的例子)。
该函数为每个摄像机调用VideoCapture::grab(),然后调用调用较慢的方法VideoCapture::retrieve()解码并从每个摄像机获取帧。这种方式消除了去马赛克或运动jpeg解压等的开销,恢复了帧从不同的摄像机会在时间上更接近。
简析:retrieve()函数解码并返回抓取的视频帧。
该方法解码并返回刚刚抓取的帧。如果没有抓到帧(相机已断开连接,或者视频文件中没有更多帧),该方法返回false。函数返回一个空图像(使用%cv::Mat,使用Mat::empty()测试它)
//这两个函数一般一起使用
cap.grab();
cap.retrieve(src);//src是每帧的图像对象
5、read()函数:
简析:获取、解码并返回下一个视频帧
cap.read(src);
6、set()函数:
简析:设置VideoCapture中的属性
cap.set(3, 480)
//把视频流的帧(图片)的高度调成480帧的,宽度为5
6、get()函数:
简析:返回指定的VideoCapture属性
cap.get(0)
//视频文件的当前位置(播放)以毫秒为单位
四、视频的人脸识别
代码块:
//视频的人脸识别
#include <iostream>
#include <opencv2/opencv.hpp>
#include <facedetectcnn.h>
#include <stdlib.h>
#define DETECT_BUFFER_SIZE 0x20000 //定义缓冲区大小
#define FACEDETECTION_EXPORT
using namespace std;
using namespace cv;
int main() {
Mat src, dst, image;
VideoCapture cap;
int count = 1;
cap.open("D:\\Myfile\\素材照片\\视频图像截取\\视频1.avi");
if (cap.isOpened()) {
//pBuffer用来检测人脸
unsigned char* pBuffer = new unsigned char[DETECT_BUFFER_SIZE]; //multiple threads
//是多线程时,要分配内存空间
if (!pBuffer) {
//如果无法分配内存,就返回could not alloc buffer!
cout << "could not alloc buffer!" << endl;
return 0;
}
system("cls"); //清屏
while (true)
{
cap >> src;// cap.read(src);
if (!src.data) {
//若不存在就返回 could not load your image!
cout << "could not load your image!" << endl;
return 0;
}
dst = src.clone(); //将src原图像复制给dst
TickMeter myClock; //计时器
myClock.start();
int* pResults = NULL; //用来检测人脸
pResults = facedetect_cnn(pBuffer, (unsigned char*)(src.ptr(0)), src.cols, src.rows, src.step);
//利用facedetect_cnn函数来获取人脸,用于存储人脸检测结果的缓冲存储器!其大小必须为0x20000字节
//facedetect_cnn函数识别的图像必须为BGR三通道的图像,而非rgb图像
myClock.stop();
cout << "这帧图像的耗费时长:" << myClock.getTimeSec() << "s" ; //输出检测人脸耗费时长
for (int i = 0; i < (pResults ? (*pResults) : 0); i++) {
//如果pResult为NULL,即pResult没有检测到人脸,就返回0,for循环结束
short* p = ((short*)(pResults + 1)) + (142 * i);
//p指针用来指向
int confidence = p[0];
if (confidence < 88) {
cout << "------这帧图像没有人脸!!!\n\n";
continue;
}
else cout << "--这帧图像有人脸!!!\n";
int x = p[1];
int y = p[2];
int w = p[3];
int h = p[4];
//显示脸的分数。其范围为[0-100]
char sScore[256];
snprintf(sScore, 256, "%d", confidence);
/*从给定位置加载数据,转换为字符串等价版本,并将结果写入各种池。
1) 写结果到 stdout 。2) 写结果到文件流 stream 。3) 写结果到字符串 buffer 。
4) 写结果到字符串 buffer 。至多写 buf_size - 1 个字符。产生的字符串会以空字符终止,除非 buf_size 为零。
若buf_size为零,则不写入任何内容,且buffer可以是空指针,然而依旧计算返回值(会写入的字符数,不包含空终止符)并返回。
若调用 sprintf 或 snprintf 导致在重叠的对象间发生复制,则行为未定义。
(例如 sprintf(buf, "%s text", buf); )*/
putText(dst, sScore, Point(x, y - 3), FONT_HERSHEY_SIMPLEX, 0.5, Scalar(0, 255, 0), 1);
//计算文本字符串的宽度和高度
//把脸用矩形画出来
rectangle(dst, Rect(x, y, w, h), Scalar(0, 255, 0), 2);
image = dst(Rect(x, y, w, h));
//画五个不同颜色的面部标志
circle(dst, Point(p[5], p[5 + 1]), 1, Scalar(255, 0, 0), 2);
circle(dst, Point(p[5 + 2], p[5 + 3]), 1, Scalar(0, 0, 255), 2);
circle(dst, Point(p[5 + 4], p[5 + 5]), 1, Scalar(0, 255, 0), 2);
circle(dst, Point(p[5 + 6], p[5 + 7]), 1, Scalar(255, 0, 255), 2);
circle(dst, Point(p[5 + 8], p[5 + 9]), 1, Scalar(0, 255, 255), 2);
//circle()绘制简单或粗椭圆弧或填充椭圆扇区。
/*
Point类的实例可以与C结构、CvPoint和CvPoint2D32f互换。
还有一个cast操作符将点坐标转换为指定的类型。
从浮点坐标到整数坐标的转换是通过舍入完成的。
通常,转换对每个坐标都使用此操作。
*/
printf("face %d: confidence=%d, [%d, %d, %d, %d] (%d,%d) (%d,%d) (%d,%d) (%d,%d) (%d,%d)\n\n",
i, confidence, x, y, w, h, p[5], p[6], p[7], p[8], p[9], p[10], p[11], p[12], p[13], p[14]);
namedWindow("output_detect_image", WINDOW_AUTOSIZE);
imshow("output_detect_image", dst); //输出识别后的图像
string str = "D:\\Myfile\\素材照片\\视频图像截取\\" + to_string(count) + ".jpg"; //制定保存的命名规则
imwrite(str, image); //将人脸截取出来并保存起来
count++;
waitKey(4000); //让每一张图片停留4s
}
}
//release the buffer
delete pBuffer;
}
else cout << "could not load video!" << endl;
cap.release();
return 0;
}
运行结果:
总结
本文简述了videoCapture类的使用,并且进行了视频的人脸识别
参考来源
https://github.com/ShiqiYu/libfacedetection#cnn-based-face-detection-on-windows
如有疑问,请留言!
如有错误,敬请指教!