1.简介
上一篇中我们已经搭建好了环境,下面就该进入正题了。要想通过TensorFlow实现人脸识别,并“认识我”,需要准备两个数据集:一个是自己的人脸,一个是其他人的人脸。
在准备好这两个数据集过后,我们便可以来训练神经网络,让她“认出我”。
仍然参考了http://tumumu.cn/2017/05/02/deep-learning-face/ 这篇博客。
其他人脸的数据集使用了这个,可以通过百度云下载,有20w张人脸
http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
注意这里只需要下载img_align_celeba.zip这个压缩包就可以了,不用把整个20多G的文件下下来。用这个数据集的弊端就是不论是图片处理、训练还是运行程序都非常非常慢,一定要做好心理准备。。。
当然你也可以选择小的很多的LFW数据集,大概就1w多张人脸,跑起来特别快,但是测试下来准确率就一般般了。
2.获取本人的照片
这里需要大概10000张自己的照片,数量太少是会影响准确度的。我们通过opencv+dlib来实现图片处理与人脸识别。
这里用opencv来做文件处理,用dlib自带的dlib.get_frontal_face_detector()来检测正脸,并将其保存至my_faces文件夹。下面给出代码:
get_my_faces.py文件:
# -*- codeing: utf-8 -*-
import cv2
import dlib
import os
import sys
import random
#输出路径,同目录下的my_faces文件夹
output_dir = './my_faces'
#保存的图片为64*64
size = 64
#如果该路径不存在则创建一个
if not os.path.exists(output_dir):
os.makedirs(output_dir)
# 改变图片的亮度与对比度
def relight(img, light=1, bias=0):
#shape[1]是图片像素的列数(即width)
w = img.shape[1]
#shape[0]是图片像素的行数(即height)
h = img.shape[0]
#遍历每个像素,img[行,列,BGR三元组的某一项]
for i in range(0,w):
for j in range(0,h):
for c in range(3):
tmp = int(img[j,i,c]*light + bias)
if tmp > 255:
tmp = 255
elif tmp < 0:
tmp = 0
img[j,i,c] = tmp
return img
#使用dlib自带的frontal_face_detector作为我们的特征提取器
detector = dlib.get_frontal_face_detector()
# 打开摄像头 参数为输入流,可以为摄像头或视频文件
camera = cv2.VideoCapture(0)
#图片的开始下标记
index = 1
while True:
if (index <= 10100):
print('Being processed picture %s' % index)
# 从摄像头读取照片
success, img = camera.read()
# 转为灰度图片
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 使用detector进行人脸检测
dets = detector(gray_img, 1)
#对于一个可迭代的/可遍历的对象,enumerate将其组成一个索引序列
#利用它可以同时获得索引(i)和值(d)
#left:人脸左边距离图片左边界的距离 ;right:人脸右边距离图片左边界的距离
#top:人脸上边距离图片上边界的距离 ;bottom:人脸下边距离图片上边界的距离
for i, d in enumerate(dets):
x1 = d.top() if d.top() > 0 else 0
y1 = d.bottom() if d.bottom() > 0 else 0
x2 = d.left() if d.left() > 0 else 0
y2 = d.right() if d.right() > 0 else 0
#提取img中的一部分img[y:y+h,x:x+w]
face = img[x1:y1,x2:y2]
#调整图片的对比度与亮度, 对比度与亮度值都取随机数,这样能增加样本的多样性
#uniform()用于生成一个指定范围内的实数
#randint()用于生成一个指定范围内的整数
face = relight(face, random.uniform(0.5, 1.5), random.randint(-50, 50))
#图像缩放至64*64
face = cv2.resize(face, (size,size))
cv2.imshow('image', face)
cv2.imwrite(output_dir+'/'+str(index)+'.jpg', face)
index += 1
key = cv2.waitKey(30) & 0xff
if key == 27:
break
else:
print('Finished!')
break
#while循环结束
程序运行时需要坐在电脑面前不停的让前置摄像头给自己拍照,挺慢的,可以分批进行。
3.提取其他人的人脸
这里的思路与之前相似,只不过改成了从指定文件夹读取图片。我们将下载好的数据集放到input_img文件夹,然后运行程序就行。这一步也就花了4个小时,毕竟20w的数据集。
set_other_people.py文件:
# -*- codeing: utf-8 -*-
import sys
import os
import cv2
import dlib
#准备好的数据集
input_dir = './input_img'
#输出路径
output_dir = './other_faces'
size = 64
if not os.path.exists(output_dir):
os.makedirs(output_dir)
#使用dlib自带的frontal_face_detector作为我们的特征提取器
detector = dlib.get_frontal_face_detector()
index = 1
for (path, dirnames, filenames) in os.walk(input_dir):
for filename in filenames:
if filename.endswith('.jpg'):
print('Being processed picture %s' % index)
img_path = path+'/'+filename
# 从文件读取图片
img = cv2.imread(img_path)
# 转为灰度图片
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 使用detector进行人脸检测 dets为返回的结果
dets = detector(gray_img, 1)
#使用enumerate 函数遍历序列中的元素以及它们的下标
#i为索引,d为值
#left:人脸左边距离图片左边界的距离 ;right:人脸右边距离图片左边界的距离
#top:人脸上边距离图片上边界的距离 ;bottom:人脸下边距离图片上边界的距离
for i, d in enumerate(dets):
top = d.top() if d.top() > 0 else 0
bottom = d.bottom() if d.bottom() > 0 else 0
left = d.left() if d.left() > 0 else 0
right = d.right() if d.right() > 0 else 0
# img[y:y+h,x:x+w]
face = img[top:bottom,left:right]
# 调整图片的尺寸至64*64
face = cv2.resize(face, (size,size))
cv2.imshow('image',face)
# 保存图片
cv2.imwrite(output_dir+'/'+str(index)+'.jpg', face)
index += 1
key = cv2.waitKey(30) & 0xff
if key == 27:
sys.exit(0)
4.总结
这两步完成,前期的准备工作就算是做好了。这时候你的工程目录下应该有这么几个文件:
other_faces里应当有20w左右的裁剪好的其他人的人脸。