人脸检测&&对齐--MTCNN 官方代码笔记

简介

MTCNN（Multi-task convolutional neural networks）是ECCV2016年提出、用以解决人脸检测以及人脸对齐任务的一篇文章，这里不对文章技术细节进行讲解，只是把官方的代码跑了一下，记录一下这个过程，希望也可以帮助到遇到类似问题的朋友。

首先还是象征性的贴张图，这是文章的Pipeline：
MTCNN

环境搭建

官方的代码是基于caffe搭建的，因此这个代码想跑起来基本上难点也就是把caffe配置好就行。
我的实验平台是Win10 + Matlab R2017a + cuda8.0.61 + cudnn6

1 caffe

建议windows-caffe的安装按照官方（BVLC）的代码来做：https://github.com/kpzhang93/MTCNN_face_detection_alignment
大概的步骤是这样的：
（1）Nvidia官网下载所需要的cuda版本并安装，以及对应的Cudnn；
（2）看清楚caffe官网要求的Dependencies：

主要是需要用到VS的编译器cl.exe，CMake安装并添加环境变量，Python的接口是默认编译的，推荐使用anaconda，Matlab接口默认不编译，但是MTCNN的代码是用的matlab接口，因此这个在后面的的配置文件里面需要稍作修改。
（3）推荐使用Ninja，编译的时候非常快，安装只需要两句话：

conda config --add channels conda-forge
conda install ninja --yes

安装过程可能比减慢，conda安装时候的网速一直是个谜。
（4）Download整个caffe的代码，修改 scripts\build_win.cmd文件，将VS的版本（2013/2015）与MSVC_VERSION对应上，MSVC_VERSION = 12对应VS 2013，MSVC_VERSION = 14对应VS 2015；然后修改WITH_NINJA为1，使用Ninja编译；最后打开matcaffe的接口，BUILD_MATLAB=1。
（5）到主目录下面打开cmd，执行：

scripts\build_win.cmd

然后静待一个世纪，就会发现。。。。。。编译失败了，一般情况下只要你的Cuda、Cudnn默认安装，路径没有问题的话，一遍过还是没有问题的。

当你看到类似上面的信息时候，caffe编译过程算是通过了。
（6）测试Matcaffe接口：

还是到主目录下面执行：

python scripts\download_model_binary.py models\bvlc_reference_caffenet

下载这个Image Classification的模型文件，随后打开matlab，看一下matlab/demo/classification_demo.m 能不能正常运行起来，如果OK，那么今天基本就OK了。比如我到这里就遇到这个问题：

报错：
出错 caffe.Net/delete (line 73)
caffe_('delete_net', self.hNet_self);

幸运的是这个方法解决了我的问题。

2 Pdollar toolbox

这个简单，到这里下载一个版本新一点的toolbox，解压记住路径就可以了。

MTCNN示例代码

至此所需要的环境都已经搭建完毕了，到MTCNN的代码路径下面去，打开\MTCNN_face_detection_alignment-master\code\codes\MTCNNv2\demo.m，修改8、9行代码的路径：

caffe_path='D:\zhangboshen\code\caffeWin20180815\caffe-windows';
pdollar_toolbox_path='D:\softwares\matlab\piotr_toolbox\toolbox';

改为你的 caffe-windows 和 pdollar_toolbox 的路径，就可以run了。
下面贴几个我的结果：

效果还是不错的，尽管在人多的时候存在一些误检测现象。