1.前言

无关风月我题序等你回，悬笔一绝那岸边浪千叠，情字何解怎落笔都不对，而我独缺你一生的了解！

2.MTCNN简介

MTCNN是一套用来做人脸检测的框架，经常会搭配着facenet人脸识别系统来一起使用。其对人脸的识别内容包括，是否是人脸、人脸位置坐标、人脸关键点识别(左眼、右眼、鼻子、左边嘴角、右边嘴角)。创新性的使用级联检测的方式来提高检测的效率，并且使用了在线困难样本选择策略来加速收敛。下面我们分别来进行描述。

3.级联网络

所有看过MTCNN的人都认识下面这个帅哥，我懒的去搜他叫什么，你看这张脸它又大又圆，就像我现在的心情又无聊又烦。从图中我们可以看到MTCNN的主要流程：1.使用图像金字塔将图像变为不同的尺寸大小。2.pnet:使用12*12的滑动窗口进行滑动，将每张结果输入到网络中进行检测，判断是否有人脸、以及人脸的位置、五个关键点，对检测完包含人脸的框进行NMS非极大值抑制 3.rnet接收pnet输出的候选框，进一步的矫正，使用非极大值抑制删除重复的框 3.onet接收rnet输出的候选框，进行矫正，最后输出,输出包括是否有人脸、候选框的位置、人脸五个关键点的位置。

上面是网络的结构图，我们看到每一层的输入尺寸成二倍的增加，其中pnet是全卷积网络，rnet和onet卷积层后面都跟着全连接层进行输出。其中的卷积层都使用娇小的卷积核3*3,2*2，减少了计算了，提高了模型的推理速度。每一层的损失都包括三个二分类交叉熵损失、候选框位置回归损失、关键点位置回归损失，

扫描二维码关注公众号，回复： 11885215 查看本文章

4.在线困难样本挖掘

以往的困难样本挖掘方式是将分错的样本加入数据集，再次进行训练，提高模型的准确性。MTCNN在训练的过程中，采用一种在线困难样本挖掘的策略。即每次正向传播完成之后，计算最大的70%的loss,然后仅对最大的这70%的loss进行反向传播更新参数。这一技巧可以加快模型的收敛速度，在论文中说可以提高整体性能的大约1.5%

5.总结

MTCNN人脸检测网络结构，其主要的贡献有三点：1.将人脸检测和关键点的定位结合起来；2.精心设计了一种级联式的网络，使用轻量级的网络结构提高了模型的性能，达到了一种实时检测的效果；3.其使用了一种在线困难样本挖掘的方式，提高了模型的性能。正文到此结束！

-------------------------------------------------------------------------------------------------------------------------------------------------

事实只能穿向，没有脚印的土壤

突兀的细微花香，刻意显眼的服装

每个人为不同的理由，戴着面具说谎

动机也只有一种名字，那叫做欲望

fafadefadefafa，dedefafadefafa

越过人性的沼泽，谁真的可以不被弄脏

我们可以遗忘原谅，但必须要知道真相

被移动过的铁床，那最后一块图终于拼上

我听见脚步声，预料的软皮鞋跟，他推开门

晚风晃了煤油灯一阵，打字机停在凶手的名称，我转身

西敏寺的夜空开始沸腾，在胸口绽放艳丽的死亡

我品尝这最后一口甜美的真相，微笑回想正义只是安静的伸张

提琴在泰晤士

周杰伦暗黑三部曲之一《夜的第七章》

深度学习之人脸检测网络MTCNN

1.前言

2.MTCNN简介

3.级联网络

4.在线困难样本挖掘

5.总结

猜你喜欢