论文链接：Naive-Deep Face Recognition: Touching the Limit of LFW Benchmark or Not?

中心思想

这是旷世科技团队写的一篇关于人脸识别研究现状反思的论文。

作者认为，虽然近年来人脸识别算法的准确度在不断提高，但是算法需要使用的训练数据量也在不断提高，也就是说要给算法喂的数据量也在不断提高。因此难免会让人这么想，也许算法本身的提高并不大，准确度的提升完全归功于越来越大的训练数据量。

近期算法训练数据量的提升如下图：
这里写图片描述

实验

为了证明数据量大小对网络准确度的影响，作者还做了实验。实验中，作者构建的神经网络没有采用任何特殊的技巧，作者描述它为a simple straightforward deep network，它有十个卷积层，尾部接了一个Softmax来进行监督学习。
实验的训练数据使用作者自己构建的一个名为MFC的训练数据库，它包含了两万人，共5M的图片。
MFC数据库的统计数据如下：
这里写图片描述
然后使用不同的数据量进行训练，系统的准确率如下图（b）：

由于是随机的选取Individual，网络的验证准确率基本是随着的线性提升.
图（c）中展示了长尾现象（Long tail effect），也就是图(c)中的Individual是将数据库中每个人所有的图片数量由大到小排列的，图片多的Individual排前面，图片少的排后面。长尾现象是指使用图片多的Individual进行训练时，系统的准确率会明显提升，而在后半部分实验中，由于那种图片量少的Individual越来越多，会对网络的学习造成负面影响，这种情况下就算喂的数据不断增多，网络准确率反而会下降。

算法的影响在数据量提升中被淡化

作者同样在MFC上尝试了一系列复杂的算法，如联合贝叶斯算法，聚类算法，以及添加类似deepid网络的分类与验证信号，结果发现这些算法对网络准确率的提高微乎其微，远远比不上数据量的提升来的大。

表现最优的人脸识别系统整体结构

如图：
这里写图片描述
每张图片切分成4个patch，训练时使用Softmax损失，验证时使用PCA降维后直接计算L2距离，最终在LFW上达到了99:50%的准确率，基本是达到了人类的识别能力的水平（人类在LFW上进行验证识别大约可以达到99.7%的准确率）

在LFW基准上接近人类的人脸识别系统真的有效吗？

作者将这一所谓的‘99.50%’准确率的系统用在CHID(一个中国人的人脸库，不同于LFW，它具有区域特异性)，发现当选择合适的阈值把假阳性率控制为10^-5时，真阳性率只有66%,远远不能达到实际可用的标准。
因此作者提出，现今人脸识别算法只能称为Naive-Deep Face Recognition，人脸识别算法的研究还有很长的路要走。

人脸识别系列（五）：face++

中心思想

实验

算法的影响在数据量提升中被淡化

表现最优的人脸识别系统整体结构

在LFW基准上接近人类的人脸识别系统真的有效吗？

猜你喜欢