通过Python+TensorFlow实现人脸识别(二)

1.简介

上一篇中我们已经搭建好了环境,下面就该进入正题了。要想通过TensorFlow实现人脸识别,并“认识我”,需要准备两个数据集:一个是自己的人脸,一个是其他人的人脸。

在准备好这两个数据集过后,我们便可以来训练神经网络,让她“认出我”。

仍然参考了http://tumumu.cn/2017/05/02/deep-learning-face/ 这篇博客。

其他人脸的数据集使用了这个,可以通过百度云下载,有20w张人脸
http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
这里写图片描述
注意这里只需要下载img_align_celeba.zip这个压缩包就可以了,不用把整个20多G的文件下下来。用这个数据集的弊端就是不论是图片处理、训练还是运行程序都非常非常慢,一定要做好心理准备。。。

当然你也可以选择小的很多的LFW数据集,大概就1w多张人脸,跑起来特别快,但是测试下来准确率就一般般了。

2.获取本人的照片

这里需要大概10000张自己的照片,数量太少是会影响准确度的。我们通过opencv+dlib来实现图片处理与人脸识别。

这里用opencv来做文件处理,用dlib自带的dlib.get_frontal_face_detector()来检测正脸,并将其保存至my_faces文件夹。下面给出代码:

get_my_faces.py文件:

# -*- codeing: utf-8 -*-
import cv2
import dlib
import os
import sys
import random

#输出路径,同目录下的my_faces文件夹
output_dir = './my_faces'
#保存的图片为64*64
size = 64

#如果该路径不存在则创建一个
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

# 改变图片的亮度与对比度
def relight(img, light=1, bias=0):
    #shape[1]是图片像素的列数(即width)
    w = img.shape[1]
    #shape[0]是图片像素的行数(即height)
    h = img.shape[0]
    #遍历每个像素,img[行,列,BGR三元组的某一项]
    for i in range(0,w):
        for j in range(0,h):
            for c in range(3):
                tmp = int(img[j,i,c]*light + bias)
                if tmp > 255:
                    tmp = 255
                elif tmp < 0:
                    tmp = 0
                img[j,i,c] = tmp
    return img


#使用dlib自带的frontal_face_detector作为我们的特征提取器
detector = dlib.get_frontal_face_detector()
# 打开摄像头 参数为输入流,可以为摄像头或视频文件
camera = cv2.VideoCapture(0)

#图片的开始下标记
index = 1
while True:
    if (index <= 10100):
        print('Being processed picture %s' % index)
        # 从摄像头读取照片
        success, img = camera.read()
        # 转为灰度图片
        gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
        # 使用detector进行人脸检测
        dets = detector(gray_img, 1)

        #对于一个可迭代的/可遍历的对象,enumerate将其组成一个索引序列
        #利用它可以同时获得索引(i)和值(d)
        #left:人脸左边距离图片左边界的距离 ;right:人脸右边距离图片左边界的距离 
        #top:人脸上边距离图片上边界的距离 ;bottom:人脸下边距离图片上边界的距离
        for i, d in enumerate(dets):
            x1 = d.top() if d.top() > 0 else 0
            y1 = d.bottom() if d.bottom() > 0 else 0
            x2 = d.left() if d.left() > 0 else 0
            y2 = d.right() if d.right() > 0 else 0

            #提取img中的一部分img[y:y+h,x:x+w]
            face = img[x1:y1,x2:y2]

            #调整图片的对比度与亮度, 对比度与亮度值都取随机数,这样能增加样本的多样性
            #uniform()用于生成一个指定范围内的实数
            #randint()用于生成一个指定范围内的整数
            face = relight(face, random.uniform(0.5, 1.5), random.randint(-50, 50))

            #图像缩放至64*64
            face = cv2.resize(face, (size,size))

            cv2.imshow('image', face)

            cv2.imwrite(output_dir+'/'+str(index)+'.jpg', face)

            index += 1

        key = cv2.waitKey(30) & 0xff
        if key == 27:
            break
    else:
        print('Finished!')
        break
#while循环结束

程序运行时需要坐在电脑面前不停的让前置摄像头给自己拍照,挺慢的,可以分批进行。

3.提取其他人的人脸

这里的思路与之前相似,只不过改成了从指定文件夹读取图片。我们将下载好的数据集放到input_img文件夹,然后运行程序就行。这一步也就花了4个小时,毕竟20w的数据集。

set_other_people.py文件:

# -*- codeing: utf-8 -*-
import sys
import os
import cv2
import dlib

#准备好的数据集
input_dir = './input_img'

#输出路径
output_dir = './other_faces'
size = 64

if not os.path.exists(output_dir):
    os.makedirs(output_dir)

#使用dlib自带的frontal_face_detector作为我们的特征提取器
detector = dlib.get_frontal_face_detector()

index = 1
for (path, dirnames, filenames) in os.walk(input_dir):
    for filename in filenames:
        if filename.endswith('.jpg'):
            print('Being processed picture %s' % index)
            img_path = path+'/'+filename
            # 从文件读取图片
            img = cv2.imread(img_path)
            # 转为灰度图片
            gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
            # 使用detector进行人脸检测 dets为返回的结果
            dets = detector(gray_img, 1)

            #使用enumerate 函数遍历序列中的元素以及它们的下标
            #i为索引,d为值
            #left:人脸左边距离图片左边界的距离 ;right:人脸右边距离图片左边界的距离 
            #top:人脸上边距离图片上边界的距离 ;bottom:人脸下边距离图片上边界的距离
            for i, d in enumerate(dets):
                top = d.top() if d.top() > 0 else 0
                bottom = d.bottom() if d.bottom() > 0 else 0
                left = d.left() if d.left() > 0 else 0
                right = d.right() if d.right() > 0 else 0
                # img[y:y+h,x:x+w]
                face = img[top:bottom,left:right]
                # 调整图片的尺寸至64*64
                face = cv2.resize(face, (size,size))
                cv2.imshow('image',face)
                # 保存图片
                cv2.imwrite(output_dir+'/'+str(index)+'.jpg', face)
                index += 1

            key = cv2.waitKey(30) & 0xff
            if key == 27:
                sys.exit(0)

4.总结

这两步完成,前期的准备工作就算是做好了。这时候你的工程目录下应该有这么几个文件:
这里写图片描述

other_faces里应当有20w左右的裁剪好的其他人的人脸。

猜你喜欢

转载自blog.csdn.net/qq_32925781/article/details/79873398