MTCNN 人脸

本质:多级联的检测识别器(检测+对齐+识别)

作者提出:1)边界框与人脸关键点存在内在的联系(检测和人脸对齐有内在联系)

                  2)面部对齐常用方法:1.基于回归算法  2.模板拟合方法

                   3)对于一个二分类问题,我们每层只需要较少的滤波器

现有方法: 1)像素特异性+随机森林 联合进行对齐和检测 

                 2)多任务CNN提高面部检测准确率,其中融合了浅层的弱面部检测信息

文中技巧:

   1.减少滤波器的数量并将5×5滤波器更改为3×3滤波器以减少计算,同时增加深度以获得更好的性能

   2.池化操作都是步长为2的卷积,可以进行通道信息的融合

   3.关键点定位任务学习有助于增强人脸分类和边界框回归任务

网络设计:

捕获.PNG

P-NET: 快速生成候选框(12-NET)       

R-NET:非人脸抑制(24-NET)

O-NET:进行人脸关键点定位(48-NET)

捕获.PNG

1.针对二分类问题:作者使用了交叉熵损失函数

            

2.针对边框回归,使用了欧式距离

            

3.针对关键点回归,仍使用欧式距离

             

4. 对损失函数进行加权调整

              

      P-Net和R-Net中使用:

      O-Net中:

      表示正样本或者负样本

5.难样本学习策略:

我们使用:

1)在P-NET中,进行样本增强(采用随机裁剪的策略形成难样本)

2)利用R-NET输出的正样本,负样本,对O-NET进行训练

3)利用R-NET 和 O-NET中输出的数据图片作为训练样本对O-NET进行训练

                            祝好~!

猜你喜欢

转载自blog.csdn.net/weixin_38740463/article/details/89073200