计算机视觉大牛

陆奇

复旦大学87届计算机系的精英，1998年加入雅虎，2007年晋升为雅虎执行副总裁。2008年8月离开雅虎，并于2009年1月正式加入微软任网络服务集团总裁。在他的带领下，Office系列软件成为微软的现金奶牛，2013年仅office为微软带来的收入就超过25亿美元，相当于Facebook整个季度的营收。陆奇所带领的Exchange、Skype、必应搜索、必应应用、MSN及广告等平台在内的产品研发与相关团队运营正是微软转型的中枢。在学术界发表过一系列高质量的研究论文，还持有40多项美国专利。最近加入百度。

傅京孙

浙江丽水人，1949年去台湾，是美籍华裔模式识别与机器智能专家，美国工程科学院院士，台湾中央科学院院士。

傅京孙是“句法结构模式识别”领域的开山鼻祖，句法结构模式识别使用小而简单的基元与语法规则描述和识别大而复杂的模式，通过对基元的识别，进而识别子模式，最终识别复杂模式。而且，这个表达还支撑了自底向上或自顶向下的计算的过程。另外他出版了5本专著和18本编著，发表过约400篇论文。

1973年，与他人组织了第一届国际模式识别会议（ICPR），后来演变成国际模式识别学会IAPR。他创办了IEEE模式分析和机器智能（PAMI）会刊，目前是计算机视觉和相关领域最权威的一本期刊。目前，国际模式识别学会IAPR设立了一个傅京孙奖，作为终身成就奖，是模式识别的最高荣誉。

黄煦涛

在计算机视觉、模式识别、多媒体等领域最资深的华人科学家。主要从事信息和信号处理方面的研究工作，发明了预测差分量化（PDQ）的两维传真（文档）压缩方法，该方法已发展为过及G3/G4FAX压缩标准；在多位数字信号处理领域中，提出了关于递归滤波器的稳定性理论；建立了从二维图像序列中估计三维运动的公式，为图像处理和计算机视觉开启了新领域。

由于在运动估计领域的研究黄煦涛被授予HONDA终身成就奖，在图像序列处理及数字电视、模式识别和计算机动画方面的应用有开创性和持续性的研究贡献，被授予IEEE Jack S.Kilby奖章及智能机器联合会信息科学奖；另外由于在图像处理、模式识别和计算机视觉领域做出的开创性研究贡献，包括：多位数字滤波器的设计和测试、数字全息摄影、文件和图像的压缩技术，以及人脸、手、躯干3D建模、分析和可视化，多模态人机界面，多媒体数据库等，黄煦涛被全球IT业界誉为计算机视觉之父。2001年11月，当选为中国工程院外籍院士。

李飞飞

李飞飞是人工智能领域少有的女性学者，尤其在图像识别领域可谓是一个家喻户晓的人物。

让机器看懂世界是人工智能行业长久以来的目标。然而，虽然人看世界好像很简单，我们可以轻易识别什么是猫什么是狗，但对于计算机而言，他们对此却非常困难。不过，好在近年深度学习技术的出现，让计算机视觉技术也有了极大的发展。但深度学习只是一个通用技术，而为了更好更准确的应用于图像识别则需要开发者做更多的算法优化。目前像谷歌、微软、百度这样的科技巨头都有在该领域研究。

作为全球计算机视觉邻域的知名专家，李飞飞的主要贡献在于参与建立了两个被AI研究者广泛使用来教机器分类物体的数据库：Caltech 101和ImageNet，而后者，目前已经成为了全球最大的图像识别数据库。

依据ImageNet数据库，斯坦福每年都会举办一个视觉识别挑战赛。而参加这个比赛的参与者便是像谷歌、微软、百度这样的科技巨头。就在过去几年中，系统的图像是被功能大大提高，出错率仅为约5%（比人眼还低）。可以说正是该比赛的存在不仅为我们找到了图像识别领域最好的算法，同时也促进了图像识别的发展。显然，李飞飞对计算机视觉乃至整个人工智能的发展都是最大的功臣之一。

吴恩达

吴恩达是斯坦福大学计算机科学系和电子工程系副教授，人工智能实验室主任。吴恩达主要成就在机器学习和人工智能邻域，他是人工智能和机器学习领域最权威的学者之一。

2010年，时任斯坦福大学教授的吴恩达加入谷歌开发团队XLab，2011年，吴恩达在谷歌成立了“Google Brain”项目，这个项目利用谷歌的分布式计算框架计算和学习大规模人工神经网络。这个项目重要研究成果是，在16000个CPU核心上利用深度学习算法学习到的10亿参数的神经网络，能够在没有任何先验知识的情况下，仅仅通过观看一周无标注的YouTube的视频自主学习到识别高级别的概念，如猫，这就是著名的“Google Cat”。

同时，吴恩达还是免费大型公开在线课程项目Coursera的联合创始人，Coursera提供在线免费的网络公开课程（其中有大量关于人工智能的课程）。Coursera的首批合作院校包括斯坦福大学、密歇根大学、普林斯顿大学、宾夕法尼亚大学等美国名校。截止2014年底，Coursera注册人数便已经超过了1000万人，其中很多人便来自中国。可以说，正是吴恩达让很多人真正认识了机器学习。

2014年5月6日，百度宣布吴恩达加入百度，担任百度公司首席科学家，负责百度研究院的领导工作，尤其是Baidu Brain计划。吴恩达加盟百度被认为是中国互联网公司迄今为止引入的最重要的外援。

黄广斌

新加坡南洋理工大学终身正教授，被汤申路透评为“高被引学者”（工程，计算机科学），新加坡总统科学奖被提名人（2016）。

其最大的贡献便是针对半监督机器学习存在的学习速度缓慢、不确定性递增等问题，提出了一种基于极端学习机的半监督学习方法，即Extreme Learning Machines（ELM，超限学习机）。仿真结果表明，其能够显著提高半监督学习的速度并有效减小对标记样本的依赖程度。

在深度学习测试一交通路牌标识识别库上，国防科大研究人员只用一个CNN做特征提取+ELM分类，达到25个DNN组合的最佳准确率（99.4%），训练时间从深度学习GPU上的37+小时缩短到CNN+ELM在PC上的5+小时（ELM的训练时间是28分钟）。

马毅

2006年到2011年任伊利诺伊大学厄巴纳香槟分校电子与计算机工程系副教授；于2009年至2014年任微软研究院计算机视觉组主任及首席研究员。2014年全职加入上海科技大学信息科学与技术学院。获得过1999年国际计算机视觉大会David Marr Prize；2004年美国自然科学基金优秀青年学者奖CAREER Award；2005年美国海军部杰出青年学者奖Young Investigator Award；2011年微软优秀员工金星奖Gold Star Award；IEEE计算机学会2013年IEEE Fellow。

马毅的一个重要贡献便是找到了一种进行图像识别的全新方法，在人脸识别等各个领域都有重要应用。

传统上，用计算机进行人脸识别是基于局部区域的特征例如眼睛、鼻子的形状，或者嘴巴宽度等。但是马毅和他的同事证明，一个随机提取的特征点集—一个包含了几百个点的稀疏表示—可以提供足量的信息来确定一幅图像在一个图像集中所对应的对象。这个方法的关键是收集足够的数据，来获取高精确度的识别。

该方法能够实现一些不可思议的事情，比如正确识别带着墨镜或围巾等有部分遮挡的人脸，或是一些已经损毁的不成样子的照片等。在一个测试中，从一个叫AR的人脸数据库中选出一个包含50名男性和50名女性受试者的集合，这个新算法对男性受试者达到百分之百准确，对女性受试者则有百分之九十五的精确度，而这些受试者当时是戴了墨镜的！

这就是他关于人脸识别的贡献，利用“稀疏表示（sparserepresentation）”的分析原理和算法工具，来引领一个能够处理损毁和遮挡的全新的、足够鲁棒的人脸识别方法。并且，所达到的性能不仅远远超过对于计算机视觉的期望，更加超过人类本身的能力所及。

孙剑

2015 年 12 月 10 日，在 ImageNet 计算机识别挑战赛中，由首席研究员孙剑带领的微软亚洲研究院视觉计算组，通过 152 层神经网络的应用，以绝对优势获得图像分类、物体定位以及物体检测全部三个主要项目的冠军。

半年前，孙剑博士离开微软研究院入 Face++ 旷视科技（以下简称 Face++）任首席科学家兼 Research 负责人，引发业内热议。孙剑博士于半月前撰写了《创业公司里的研究之美》，详细描述了 Face++ 的研究方向、展开研究的方式。在他看来，无论是使命定位、人员组成和研发方式，Face++ 的 Research 和 MSR 的研究没有本质差别，都是一群富有 Geek 精神的自我驱动者在探索前沿技术。

Face++也不是只研究人脸。最关心4个计算机视觉的核心问题（图像分类、物体检测、语义分割、和序列学习），还有核心网络训练问题、底层架构问题、深度学习平台问题等。

这里写图片描述

参考链接

AI领域的顶级华人面孔
 Face++旷视科技首席科学家孙剑首次接受专访：计算机视觉亟待解决哪些问题？

陆奇

傅京孙

黄煦涛

李飞飞

吴恩达

黄广斌

马毅

孙剑

参考链接

猜你喜欢