Bootstrapping Face Detection with Hard Negative Examples

这篇文章是小米2016年的FDDB人脸检测第一名的文章。作者万韶华,博士。

文章主要是基于fasterRCNN的框架进行人脸检测。主要优化的地方在于难例挖掘(hard negative mining)。

文章中的难例挖掘思路和传统的训练cascade人脸检测的思路很像。先是使用传统的fasterRCNN跑一次,然后将得到的hardexamples输入下一次的网络训练集中,如此迭代的反复训练。虽然和OHEM有一样的效果,但是思路上却不像OHEM这样传hard examples的梯度更novel。当然从工程的角度来看,该方法想对OHEM更容易实现。


从上图的FDDB实验结果可以看出,不管是基于离散分数的ROC曲线还是基于连续分数的ROC曲线,本文的方法都取得了第一名的准确性。

其中,FRCNN_VGG16是基于VGG16训练的人脸检测模型,FRCNN_R50是基于Resnet50训练的人脸检测模型,但是没有使用hardnegative mining,但是FRCNN_R50_HNM同样使用Resnet50训练,并且加入了hardnegative mining,取得了最优的成绩。

另外,这里离散的ROC曲线是指的每一次预测只区分是不是人脸。

连续的ROC曲线,是指每次预测的时候,根据ROI设置不同的值来得出该值下的falsepositive和true positive,从而绘制出ROC曲线。

文章arxiv链接:https://arxiv.org/pdf/1608.02236.pdf


猜你喜欢

转载自blog.csdn.net/qq_14845119/article/details/79321694