深度学习之人脸检测网络MTCNN

1.前言 

                   无关风月 我题序等你回,悬笔一绝 那岸边浪千叠,情字何解 怎落笔都不对,而我独缺 你一生的了解!

2.MTCNN简介

     MTCNN是一套用来做人脸检测的框架,经常会搭配着facenet人脸识别系统来一起使用。其对人脸的识别内容包括,是否是人脸、人脸位置坐标、人脸关键点识别(左眼、右眼、鼻子、左边嘴角、右边嘴角)。创新性的使用级联检测的方式来提高检测的效率,并且使用了在线困难样本选择策略来加速收敛。下面我们分别来进行描述。

3.级联网络

                                    

      所有看过MTCNN的人都认识下面这个帅哥,我懒的去搜他叫什么,你看这张脸它又大又圆,就像我现在的心情又无聊又烦。从图中我们可以看到MTCNN的主要流程:1.使用图像金字塔将图像变为不同的尺寸大小。2.pnet:使用12*12的滑动窗口进行滑动,将每张结果输入到网络中进行检测,判断是否有人脸、以及人脸的位置、五个关键点,对检测完包含人脸的框进行NMS非极大值抑制 3.rnet接收pnet输出的候选框,进一步的矫正,使用非极大值抑制删除重复的框 3.onet接收rnet输出的候选框,进行矫正,最后输出,输出包括是否有人脸、候选框的位置、人脸五个关键点的位置。

                              

                               

                               

    上面是网络的结构图,我们看到每一层的输入尺寸成二倍的增加,其中pnet是全卷积网络,rnet和onet卷积层后面都跟着全连接层进行输出。其中的卷积层都使用娇小的卷积核3*3,2*2,减少了计算了,提高了模型的推理速度。每一层的损失都包括三个 二分类交叉熵损失、候选框位置回归损失、关键点位置回归损失,

  

扫描二维码关注公众号,回复: 11885215 查看本文章

4.在线困难样本挖掘

          以往的困难样本挖掘方式是将分错的样本加入数据集,再次进行训练,提高模型的准确性。MTCNN在训练的过程中,采用一种在线困难样本挖掘的策略。即每次正向传播完成之后,计算最大的70%的loss,然后仅对最大的这70%的loss进行反向传播更新参数。这一技巧可以加快模型的收敛速度,在论文中说可以提高整体性能的大约1.5%

5.总结

        MTCNN人脸检测网络结构,其主要的贡献有三点:1.将人脸检测和关键点的定位结合起来;2.精心设计了一种级联式的网络,使用轻量级的网络结构提高了模型的性能,达到了一种实时检测的效果;3.其使用了一种在线困难样本挖掘的方式,提高了模型的性能。正文到此结束!

-------------------------------------------------------------------------------------------------------------------------------------------------

事实只能穿向,没有脚印的土壤

突兀的细微花香,刻意显眼的服装

每个人为不同的理由,戴着面具说谎

动机也只有一种名字,那叫做欲望

fafadefadefafa,dedefafadefafa

越过人性的沼泽,谁真的可以不被弄脏

我们可以遗忘原谅,但必须要知道真相

被移动过的铁床,那最后一块图终于拼上

我听见脚步声,预料的软皮鞋跟,他推开门 

晚风晃了煤油灯一阵,打字机停在凶手的名称,我转身

西敏寺的夜空开始沸腾,在胸口绽放艳丽的死亡

我品尝这最后一口甜美的真相,微笑回想正义只是安静的伸张

提琴在泰晤士

周杰伦暗黑三部曲之一《夜的第七章》

猜你喜欢

转载自blog.csdn.net/gaobing1993/article/details/108347656
今日推荐