tensorflow实战小项目——面部表情识别（4）

在前文中，我们已经构建好了CNN网络，并且在50000轮后跑出了93.4%的训练准确率。

下面，我们就要来实现从摄像头来识别人脸并对我们做出的表情做出判断。

从摄像头来识别人脸，我们要用到openCV技术以及写好的人脸识别器。人脸识别器有许多种，我们此次选用haarcascade_frontalface_default.xml这个分类器。

使用摄像头截取人像的时候，我们将摄像头此时的一帧图像截取并保存下来。代码如下：

import cv2

###调用电脑摄像头检测人脸并截图

def CatchPICFromVideo(window_name, camera_idx, catch_pic_num, path_name):
    cv2.namedWindow(window_name)

    #视频来源，可以来自一段已存好的视频，也可以直接来自USB摄像头
    cap = cv2.VideoCapture(camera_idx)

    #告诉OpenCV使用人脸识别分类器
    classfier = cv2.CascadeClassifier\
        ("C:\\Users\\Desktop\\project\\dataset\\haarcascade_frontalface_default.xml")

    #识别出人脸后要画的边框的颜色，RGB格式, color是一个不可增删的数组
    color = (0, 255, 0)

    num = 0
    while cap.isOpened():
        ok, frame = cap.read() #读取一帧数据
        if not ok:
            break

        grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)  #将当前桢图像转换成灰度图像

        #人脸检测，1.2和2分别为图片缩放比例和需要检测的有效点数
        faceRects = classfier.detectMultiScale(grey, scaleFactor = 1.2, minNeighbors = 3, minSize = (32, 32))
        if len(faceRects) > 0:          #大于0则检测到人脸
            for faceRect in faceRects:  #单独框出每一张人脸
                x, y, w, h = faceRect

                #将当前帧保存为图片
                img_name = "%s/%d.jpg" % (path_name, num)
                #print(img_name)
                image = frame[y - 10: y + h + 10, x - 10: x + w + 10]
                cv2.imwrite(img_name, image,[int(cv2.IMWRITE_PNG_COMPRESSION), 9])

                num += 1
                if num > (catch_pic_num):   #如果超过指定最大保存数量退出循环
                    break

                #画出矩形框
                cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)

                #显示当前捕捉到了多少人脸图片了，这样站在那里被拍摄时心里有个数，不用两眼一抹黑傻等着
                font = cv2.FONT_HERSHEY_SIMPLEX
                cv2.putText(frame,'num:%d/100' % (num),(x + 30, y + 30), font, 1, (255,0,255),4)

                #超过指定最大保存数量结束程序
        if num > (catch_pic_num): break

        #显示图像
        cv2.imshow(window_name, frame)
        c = cv2.waitKey(10)
        if c & 0xFF == ord('q'):
            break

            #释放摄像头并销毁所有窗口
    cap.release()
    cv2.destroyAllWindows()

这样调用CatchPICFromVideo()这个函数可以生成瞬时帧的图片，并将其命名为0.jpg。

接着，我们将截下来的图片进行裁剪，使之大小为48*48，并处理为灰阶位图，便于导入网络中进行预测。

import tensorflow as tf
def process():
    img = tf.gfile.GFile('C:\\Users\\huang\\Desktop\\project\\image\\0.jpg', 'rb').read()
    with tf.Session() as sess:
        img_data = tf.image.decode_jpeg(img)
        #将图像编码转化为实数形式#
        resized = tf.image.resize_images(img_data, [48, 48], method=1)
        #将图像转化为灰度图像
        image_data = sess.run(tf.image.rgb_to_grayscale(resized))
        #将处理过的图像进行解码
        encoded_image = tf.image.encode_jpeg(image_data)
        #将处理好的图像进行保存
        with tf.gfile.GFile("C:\\Users\\huang\\Desktop\\project\\image\\60.jpg", "wb") as f:
            f.write(encoded_image.eval())

这之后我们就能得到一个48*48的灰阶位图。

tensorflow实战小项目——面部表情识别（4）

猜你喜欢