人工智能里有至简的优雅吗?

我很喜欢这首古诗:

静夜思

唐·李白

床前明月光

疑是地上霜

举头望明月

低头思故乡

二十个简单汉字,勾画出生动的画面,并在无数人心里掀起波澜。

物理学里,爱因斯坦用5个符号,简单到不能再简单,揭示了我们的世界的规律。

5940984148dd8105bdbae30cabefead1.png

目光转回我的本行,我在模式识别方向做了十几年。早些年,各种方法如Boosting, Random Tree, SVM, PCA, LDA等等,逐一手写代码实现,用这些方法解决实际问题,感觉如同“唐吉柯德战风车”,总是被现实揍得鼻青脸肿。

深度学习让“唐吉柯德”的剑更坚韧和锋利了,跟风车战斗起来比以前有优势了。但离优雅的算法还有很远的路要走,好在“唐吉柯德”们不会放弃。

我用了十几年的时间斗一个“小风车”——人脸检测。无数个日夜,抱头冥思苦想,一边是简单的0/1计算机,一边是变化多端的数字图像。从数学的角度来看,一个小小的100x100的图像就有167772160000种可能性。

在高维的空间里,依赖稀疏的参考(样本),画出一个简洁优雅的分类面,是无数“唐吉柯德”们梦寐以求的目标。

我迎着这个“小风车”——人脸检测十几年,做出了一个小小的木剑,YuNet。它简单粗陋,谈不上优雅。可它有独特的优点,仅35K个参数,参数数量已经少于传统的AdaBoost方法。我们发现这个微小的模型不仅在人脸检测上有极佳的性能,而且在车牌检测等其他目标检测上面性能优异,通用性极好。

最近,我的研究生吴伟同学还在不明显增加计算量前提下,把人脸检测准确率又提升了3个百分点。要知道以前提升1个百分点,我都会激动几个月的,现在我可以激动一年了!

吴伟同学将会把这些成果公开到我们的Github站点 https://github.com/ShiqiYu/libfacedetection,而且会把YuNet作为一个backbone模型,从训练程序里独立出来,供大家应用到各种问题上。请大家监督他、督促他、让他尽快完成。下面就是他

31eb277e1e292a851479138f579532d7.gif

7cf9673cd53e899538f30a1e4f9e1751.png

猜你喜欢

转载自blog.csdn.net/u010670887/article/details/121804948