我很喜欢这首古诗:
静夜思
唐·李白
床前明月光
疑是地上霜
举头望明月
低头思故乡
二十个简单汉字,勾画出生动的画面,并在无数人心里掀起波澜。
物理学里,爱因斯坦用5个符号,简单到不能再简单,揭示了我们的世界的规律。
目光转回我的本行,我在模式识别方向做了十几年。早些年,各种方法如Boosting, Random Tree, SVM, PCA, LDA等等,逐一手写代码实现,用这些方法解决实际问题,感觉如同“唐吉柯德战风车”,总是被现实揍得鼻青脸肿。
深度学习让“唐吉柯德”的剑更坚韧和锋利了,跟风车战斗起来比以前有优势了。但离优雅的算法还有很远的路要走,好在“唐吉柯德”们不会放弃。
我用了十几年的时间斗一个“小风车”——人脸检测。无数个日夜,抱头冥思苦想,一边是简单的0/1计算机,一边是变化多端的数字图像。从数学的角度来看,一个小小的100x100的图像就有167772160000种可能性。
在高维的空间里,依赖稀疏的参考(样本),画出一个简洁优雅的分类面,是无数“唐吉柯德”们梦寐以求的目标。
我迎着这个“小风车”——人脸检测十几年,做出了一个小小的木剑,YuNet。它简单粗陋,谈不上优雅。可它有独特的优点,仅35K个参数,参数数量已经少于传统的AdaBoost方法。我们发现这个微小的模型不仅在人脸检测上有极佳的性能,而且在车牌检测等其他目标检测上面性能优异,通用性极好。
最近,我的研究生吴伟同学还在不明显增加计算量前提下,把人脸检测准确率又提升了3个百分点。要知道以前提升1个百分点,我都会激动几个月的,现在我可以激动一年了!
吴伟同学将会把这些成果公开到我们的Github站点 https://github.com/ShiqiYu/libfacedetection,而且会把YuNet作为一个backbone模型,从训练程序里独立出来,供大家应用到各种问题上。请大家监督他、督促他、让他尽快完成。下面就是他