人脸识别系列(五):face++

版权声明:转载请注明出处 https://blog.csdn.net/Fire_Light_/article/details/79590811

论文链接:Naive-Deep Face Recognition: Touching the Limit of LFW Benchmark or Not?

中心思想

这是旷世科技团队写的一篇关于人脸识别研究现状反思的论文。

作者认为,虽然近年来人脸识别算法的准确度在不断提高,但是算法需要使用的训练数据量也在不断提高,也就是说要给算法喂的数据量也在不断提高。因此难免会让人这么想,也许算法本身的提高并不大,准确度的提升完全归功于越来越大的训练数据量。

近期算法训练数据量的提升如下图:
这里写图片描述

实验

为了证明数据量大小对网络准确度的影响,作者还做了实验。实验中,作者构建的神经网络没有采用任何特殊的技巧,作者描述它为a simple straightforward deep network,它有十个卷积层,尾部接了一个Softmax来进行监督学习。
实验的训练数据使用作者自己构建的一个名为MFC的训练数据库,它包含了两万人,共5M的图片。
MFC数据库的统计数据如下:
这里写图片描述
然后使用不同的数据量进行训练,系统的准确率如下图(b):
这里写图片描述
由于是随机的选取Individual,网络的验证准确率基本是随着的线性提升.
图(c)中展示了长尾现象(Long tail effect),也就是图(c)中的Individual是将数据库中每个人所有的图片数量由大到小排列的,图片多的Individual排前面,图片少的排后面。长尾现象是指使用图片多的Individual进行训练时,系统的准确率会明显提升,而在后半部分实验中,由于那种图片量少的Individual越来越多,会对网络的学习造成负面影响,这种情况下就算喂的数据不断增多,网络准确率反而会下降。

算法的影响在数据量提升中被淡化

作者同样在MFC上尝试了一系列复杂的算法,如联合贝叶斯算法,聚类算法,以及添加类似deepid网络的分类与验证信号,结果发现这些算法对网络准确率的提高微乎其微,远远比不上数据量的提升来的大。

表现最优的人脸识别系统整体结构

如图:
这里写图片描述
每张图片切分成4个patch,训练时使用Softmax损失,验证时使用PCA降维后直接计算L2距离,最终在LFW上达到了99:50%的准确率,基本是达到了人类的识别能力的水平(人类在LFW上进行验证识别大约可以达到99.7%的准确率)

在LFW基准上接近人类的人脸识别系统真的有效吗?

作者将这一所谓的‘99.50%’准确率的系统用在CHID(一个中国人的人脸库,不同于LFW,它具有区域特异性),发现当选择合适的阈值把假阳性率控制为10^-5时,真阳性率只有66%,远远不能达到实际可用的标准。
因此作者提出,现今人脸识别算法只能称为Naive-Deep Face Recognition,人脸识别算法的研究还有很长的路要走。

猜你喜欢

转载自blog.csdn.net/Fire_Light_/article/details/79590811