使用多任务级联卷积网络进行人脸检测和对齐(MTCNN翻译)

声明下自己在翻译一篇期刊,同时自己的英语超级烂,只是想学习一下...

使用多任务级联卷积网络进行人脸检测和对齐

摘要

在无约束的环境下,由于各种各样的姿势、光线强度以及面部遮挡等原因,人脸检测和对齐是一个巨大的挑战。最近的研究表明,深度学习的方法在这两个任务上的表现令人印象深刻。在本文中,我们提出了一个深入的级联多任务框架,通过它们之间内在的相互关系去提高它们的性能。值得一提的是,我们的框架采用级联结构伴随着精心设计的深度卷积网络的三个阶段,以粗到细的方式去预测人脸和特征点的位置。除此之外,在学习的过程中,我们提出了一种新的在线硬样本挖掘方法,能够在没有手动选择样本的情况下自动提升性能。在FDDB和WIDER FACE为基准的人脸识别挑战和以ALFW为基准的人脸对齐挑战中,我们的方法在保持实时性能的同时,达到了极高的精确度并且超过了现在最新的技术。

关键字:人脸检测    人脸对齐    级联卷积神经网络

一、绪论

人脸检测和对齐是很多人脸应用的基础,如人脸识别和表情分析。然而,人脸在遮挡、姿态变换以及极端光照的巨大变化下,给这些任务在实际应用中带来了巨大的挑战。

Viola和Jones[2]提出的级联人脸检测算法利用类haar特征和adaboost来训练级联分类器,取得了良好的性能和实时性。然而,相当多的工作[1, 3, 4]表明该检测器在实际应用中的性能会显著降级,即使在具有更高级特征和分类器的情况下,人脸的视觉变化也会变得更大。在级联结构的基础上,[5, 6, 7]引入了用于人脸检测的可变模型(DPM),取得了显著的性能。然而,它们需要很高的计算开销,并且在训练阶段通常需要繁琐的标注。

发布了116 篇原创文章 · 获赞 7 · 访问量 6010

猜你喜欢

转载自blog.csdn.net/qq_40204582/article/details/102027182
今日推荐