人工智能 | 人脸识别研究报告（概念篇）

博主github：https://github.com/MichaelBeechan
博主CSDN：https://blog.csdn.net/u011344545

============================================
概念篇：https://blog.csdn.net/u011344545/article/details/89737370
技术篇：https://blog.csdn.net/u011344545/article/details/89737573
人才篇：
应用篇：

============================================
清华AMiner团队 AMiner.org

摘要
自20世纪下半叶，计算机视觉技术逐渐地发展壮大。同时，伴随着数字图像相关的软硬
件技术在人们生活中的广泛使用，数字图像已经成为当代社会信息来源的重要构成因素，各种图像处理与分析的需求和应用也不断促使该技术的革新。
人脸识别概述：人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术。报告首先介绍了人脸识别区别于其他生物特征识别方法的五项优势，包括非侵扰性、便捷性、友好性、非接触性、可扩展性等；其次我们对人脸识别技术的发展历程进行梳理；接下来，报告介绍了当代中国政府对人脸识别技术发展的相关政策支持，这是人脸识别技术在我国得以蓬勃发展的有利宏观背景；第四，通过对遗忘人脸识别领域论文的挖掘，我们总结出人脸识别领域的研究热点；最后，我们介绍了与人脸识别相关的国际著名会议，以帮助读者更好获取人脸识别热点渠道。

1、概念

人类视觉系统的独特魅力驱使着研究者们试图通过视觉传感器和计算机软硬件模拟出人类对三维世界图像的采集、处理、分析和学习能力，以便使计算机和机器人系统具有智能化的视觉功能。在过去 30 年间，众多不同领域的科学家们不断地尝试从多个角度去了解生物视觉和神经系统的奥秘，以便借助其研究成果造福人类。自 20 世纪下半叶，计算机视觉技术就在此背景下逐渐地发展壮大。同时，伴随着数字图像相关的软硬件技术在人们生活中的广泛使用，数字图像已经成为当代社会信息来源的重要构成因素，各种图像处理与分析的需求和应用也不断促使该技术的革新。
计算机视觉技术的应用十分广泛。数字图像检索管理、医学影像分析、智能安检、人机交互等领域都有计算机视觉技术的涉足。该技术是人工智能技术的重要组成部分，也是当今计算机科学研究的前沿领域。经过近年的不断发展，已逐步形成一套以数字信号处理技术。计算机图形图像、信息论和语义学相互结合的综合性技术，并具有较强的边缘性和学科交叉性。其中，人脸检测与识别当前图像处理、模式识别和计算机视觉内的一个热门研究课题，也是目前生物特征识别中最受人们关注的一个分支。
人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术。通常采用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸。根据中国报告网发布《2018 年中国生物识别市场分析报告-行业深度分析与发展前景预测》中内容，2017年生物识别技术全球市场规模上升到了 172 亿美元，到 2020 年，预计全世界的生物识别市场规模有可能达到 240 亿美元。自 2015 年到 2020 年，人脸识别市场规模增长了 166.6%，在众多生物识别技术中增幅居于首位，预计到 2020 年人脸识别技术市场规模将上升至 24 亿美元。
在不同的生物特征识别方法中，人脸识别有其自身特殊的优势，因而在生物识别中有着重要的地位。
(1) 非侵扰性
人脸识别无需干扰人们的正常行为就能较好地达到识别效果，无需担心被识别者是否愿意将手放在指纹采集设备上，他们的眼睛是否能够对准虹膜扫描装置等等。只要在摄像机前自然地停留片刻，用户的身份就会被正确识别。
(2) 便捷性
采集设备简单，使用快捷。一般来说，常见的摄像头就可以用来进行人脸图像的采集，不需特别复杂的专用设备。图像采集在数秒内即可完成。
(3) 友好性
通过人脸识别身份的方法与人类的习惯一致，人和机器都可以使用人脸图片进行识别。而指纹，虹膜等方法没有这个特点，一个没有经过特殊训练的人，无法利用指纹和虹膜图像对其他人进行身份识别。
(4) 非接触性
人脸图像信息的采集不同于指纹信息的采集，利用指纹采集信息需要用手指接触到采集设备，既不卫生，也容易引起使用者的反感，而人脸图像采集，用户不需要与设备直接接触。
(5) 可扩展性
在人脸识别后，下一步数据的处理和应用，决定着人脸识别设备的实际应用，如应用在出入门禁控制、人脸图片搜索、上下班刷卡、恐怖分子识别等各个领域，可扩展性强。
正是因为人脸识别拥有这些良好的特性，使其具有非常广泛的应用前景，也正引起学术界和商业界越来越多的关注。人脸识别已经广泛应用于身份识别、活体检测、唇语识别、创意相机、人脸美化、社交平台等场景中。

早在 20 世纪 50 年代，认知科学家就已着手对人脸识别展开研究。20 世纪 60 年代，人脸识别工程化应用研究正式开启。当时的方法主要利用了人脸的几何结构，通过分析人脸器官特征点及其之间的拓扑关系进行辨识。这种方法简单直观，但是一旦人脸姿态、表情发生变化，精度则严重下降。

2、人脸识别的发展史

在这里插入图片描述
20 世纪 90 年代
1991 年，著名的“特征脸”（Eigenface）方法第一次将主成分分析和统计特征技术引入人脸识别，在实用效果上取得了长足的进步。这一思路也在后续研究中得到进一步发扬光大，例如，Belhumer 成功将 Fisher 判别准则应用于人脸分类，提出了基于线性判别分析的Fisherface 方法。
2000–2012 年
21 世纪的前十年，随着机器学习理论的发展，学者们相继探索出了基于遗传算法、支持向量机（Support Vector Machine，SVM）、boosting、流形学习以及核方法等进行人脸识别。2009 年至 2012 年，稀疏表达（Sparse Representation）因为其优美的理论和对遮挡因素的鲁棒性成为当时的研究热点。与此同时，业界也基本达成共识：基于人工精心设计的局部描述子进行特征提取和子空间方法进行特征选择能够取得最好的识别效果。
Gabor 及 LBP 特征描述子是迄今为止在人脸识别领域最为成功的两种人工设计局部描述子。这期间，对各种人脸识别影响因子的针对性处理也是那一阶段的研究热点，比如人脸光照归一化、人脸姿态校正、人脸超分辨以及遮挡处理等。也是在这一阶段，研究者的关注点开始从受限场景下的人脸识别转移到非受限环境下的人脸识别。LFW 人脸识别公开竞赛（LFW 是由美国马萨诸塞大学发布并维护的公开人脸数集，测试数据规模为万）在此背景下开始流行，当时最好的识别系统尽管在受限的 FRGC 测试集上能取得 99%以上的识别精度，但是在 LFW 上的最高精度仅仅在 80%左右，距离实用看起来距离颇远。
2013 年
2013 年，微软亚洲研究院的研究者首度尝试了 10 万规模的大训练数据，并基于高维LBP 特征和 Joint Bayesian 方法在 LFW 上获得了 95.17%的精度。这一结果表明：大训练数据集对于有效提升非受限环境下的人脸识别很重要。然而，以上所有这些经典方法，都难以处理大规模数据集的训练场景。
2014 年
2014 年前后，随着大数据和深度学习的发展，神经网络重受瞩目，并在图像分类、手写体识别、语音识别等应用中获得了远超经典方法的结果。香港中文大学的 Sun Yi 等人提出将卷积神经网络应用到人脸识别上，采用 20 万训练数据，在 LFW 上第一次得到超过人类水平的识别精度，这是人脸识别发展历史上的一座里程碑。
自此之后，研究者们不断改进网络结构，同时扩大训练样本规模，将 LFW 上的识别精度推到 99.5%以上。人脸识别发展过程中一些经典的方法及其在 LFW 上的精度，都有一个
基本的趋势：训练数据规模越来越大，识别精度越来越高。

3、发展热点

在这里插入图片描述
研究通过对以往人脸识别领域论文的挖掘，总结出人脸识别领域的研究关键词主要集中在人脸识别、特征提取、稀疏表示、图像分类、神经网络、目标检测、人脸图像、人脸检测、图像表示、计算机视觉、姿态估计、人脸确认等领域。
图 2 是对人脸识别研究趋势的分析，旨在基于历史的科研成果数据的基础上，对技术来源、热度甚至发展趋势进行研究。图 2 中，每个彩色分支代表一个关键词领域，其宽度表示该关键词的研究热度，各关键词在每一年份的位置是按照这一时间上所有关键词的热度高度进行排序。起初，Computer Vision（计算机视觉）是研究的热点，在 20 世纪末期，FeatureExtraction（特征提取）超越 CV，成为研究的新热点，其后在 21 世纪初期被 Face Recognition超过，至今一直处在第二的位置上。
此外，研究根据最近两年发表于 FG（International Conference on Automatic Face and Gesture Recognition）的论文中提取出来的关键词发现，Face Recognition 出现频率最高，为118 次，Object Detection 排在第二位，为 41 次，Image Classification 和 Object Recognition 以36 次并列第三，出现次数超过十次的词汇还有 Image Segmentation（32）、Action Recognition（32）、Sparse Representation（28）、Image Retrieval（27）、Visual Tracking（24）、Single Image（23）。词云图如下所示：
在这里插入图片描述

4、相关会议

计算机视觉（CV）界三大顶级国际会议

ICCV ：IEEE International Conference on Computer Vision
该会议由美国电气和电子工程师学会（IEEE，Institute of Electrical & Electronic Engineers）主办，主要在欧洲、亚洲、美洲的一些科研实力较强的国家举行。作为世界顶级的学术会议，首届国际计算机视觉大会于 1987 年在伦敦揭幕，其后两年举办一届。ICCV 是计算机视觉领域最高级别的会议，会议的论文集代表了计算机视觉领域最新的发展方向和水平。论文接受率在 20%左右。方向为计算机视觉、模式识别、多媒体计算等。
近年来，全球学界愈来愈关注中国人在计算机视觉领域所取得的科研成就，这是因为由中国人主导的相关研究已取得了长足的进步——2007 年大会共收到论文 1200 余篇，而获选论文仅为 244 篇，其中来自中国大陆，香港及台湾的论文有超过 30 篇，超过大会获选论文总数的 12%。作为最早投入深度学习技术研发的华人团队，在多年布局的关键技术基础之上，香港中文大学教授汤晓鸥率领的团队迅速取得技术突破。2012 年国际计算视觉与模式识别会议（CVPR）上仅有的两篇深度学习文章均出自汤晓鸥实验室，而在 2013 年国际计算机视觉大会（ICCV）上全球学者共发表的 8 篇深度学习领域的文章中，有 6 篇出自汤晓鸥实验室。

CVPR ：IEEE Conference on Computer Vision and Pattern Recognition
该会议是由 IEEE 举办的计算机视觉和模式识别领域的顶级会议。每年召开一次，录取率在 25%左右。方向为计算机视觉、模式识别、多媒体计算等。
香港中文大学教授汤晓鸥率领的团队在全球范围内做出了大量深度学习原创技术突破：2012 年国际计算视觉与模式识别会议（CVPR）上仅有的两篇深度学习文章均出自其实验室；2011—2013 年间在计算机视觉领域两大顶级会议 ICCV 和 CVPR 上发表了 14 篇深度学习论文，占据全世界在这两个会议上深度学习论文总数（29 篇）的近一半。他在 2009 年获得计算机视觉领域两大最顶尖的国际学术会议之一 CVPR 最佳论文奖，这是 CVPR 历史上来自亚洲的论文首次获奖。

ECCV ：European Conference on Computer Vision
ECCV 是一个欧洲的会议，每次会议在全球范围录用论文 300 篇左右，主要的录用论文都来自美国、欧洲等顶尖实验室及研究所，中国大陆的论文数量一般在 10-20 篇之间。ECCV2010 的论文录取率为 27%。两年召开一次，论文接受率在 20%左右。方向为计算机视觉、模式识别、多媒体计算等。2018 年的 ECCV 于 2018 年 9 月 8 日-14 日在德国慕尼黑举办。

亚洲计算机视觉会议

ACCV ：Asian Conference on Computer Vision
ACCV 即亚洲计算机视觉会议，是 AFCV（Asian Federation of Computer Vision，亚洲计算机视觉联盟）自 1993 年以来官方组织的两年一度的会议，旨在为研究者、开发者和参与者提供一个良好的平台来展示和讨论计算机视觉领域和相关领域的新问题、新方案和新技术。2018 年第 14 届亚洲计算机视觉会议将于 2018 年 12 月 4 日-6 日在澳大利亚举办。

人脸和手势识别专门的会议

FG ：IEEE International Conference on Automatic Face and Gesture Recognition
“International Conference on Automatic Face and Gesture Recognition”是全球范围内人脸与手势识别领域的权威学术会议。会议方向有人脸检测、人脸识别、表情识别、姿势分析、心理行为分析等。