YOLO(you only look once)是通用物体检测框架,在精度和速度上作了很好的权衡;shufflenet是轻量级的网络模型,本文所实现的是version 2, 具体可参考 Face Detection in Realtime, 包括参考文献.
1. 对yolo的改进
yolo作为通用物体检测算法,物体类别有多个,如图
其中p1,p2…,pc是物体类别score,对于人脸来说只有一类,即人脸,所以将p1,p2…,pc丢弃, 只保持tx,ty,tw,th和p0,p0代表是否为物体(这里就是人脸),以此来进行判断
2. ShufflenetV2的实现
可参考keras实现的版本
keras-shufflenetV2
3. 实时人脸检测模型
在FDDB人脸数据集上进行训练,大约50轮,一些例子:
注: gif本地与视频是同步的,有卡顿应该是录制的问题