CVPR 2020 开幕！最佳论文奖等揭晓！

新智元报道

来源：CVPR 2020

编辑：新智元编辑部

【新智元导读】美国西雅图时间6月16日上午8:30（北京时间晚11:30），大家期待已久的计算机视觉和模式识别领域的「奥斯卡」CVPR 2020 开幕式暨颁奖仪式正式线上举行。获奖论文大赏：最佳论文和最佳学生论文一作都是华人！

CVPR Best Paper终于来了！

受疫情影响，今年 CVPR 改为线上会议。北京时间6月16日晚11:30，大家期待已久的计算机视觉和模式识别领域的「奥斯卡」 CVPR 2020 开幕式正式线上举行。涵盖了 Oral Session Program、Tutorials、Workshops 和 DoctoralConsortium 等一系列活动。

缅怀首位华人CVPR程序主席，成立Thomas S. Huang纪念奖

本届CVPR开篇特意缅怀了一代CV宗师、84岁华人计算机视觉泰斗Thomas S. Huang（黄煦涛）。

他是华人计算机视觉史上的关键人物，首位担任CVPR程序主席（1992）的华人。老先生一生桃李满天下，备受崇敬，为华人CV领域留下丰厚的学术遗产，

黄煦涛在图像处理、模式识别和计算机视觉领域作出了开创性研究贡献，其中包括多维数字滤波器的设计和测试、数字全息摄影、文件和图像的压缩技术，以及人脸、手、躯干3D建模、分析和可视化、多模态人机界面、多媒体数据库等。

黄煦涛教授发明了预测差分量化（PDQ）的两维传真（文档）压缩方法，该方法已发展为国际G3/G4FAX压缩标准；在多维数字信号处理领域中，提出了关于递归滤波器的稳定性的理论；建立了从二维图象序列中估计三维运动的公式，为图象处理和计算机视觉开启了新领域。此外，他的研究小组还实现了基于语音识别和可视手语分析以控制显示的系统。

缅怀视频中，收录了有关黄教授在90年代中期的一些珍贵影像资料。

PAMITC执行委员会已经批准设立计算机视觉领域的Thomas S. Huang纪念奖，从2021年开始每年在CVPR上颁发。

获奖者将由PAMITC奖励委员会选出，类似于罗森菲尔德奖，并将给出相同的奖金。

入选者必须是博士，且毕业10年。委员会将根据研究、服务和指导情况综合评选出获奖者。其他细节将在CVPR2021之前公布。

获奖论文大赏，最佳论文和最佳学生论文一作均为华人

下面重头戏来了，获奖论文环节！

最佳论文：Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild

最佳论文提出了一种无需外部监督即可从原始单视图图像中学习3D变形对象的方法。该方法基于自动编码器，该自动编码器将每个输入图像分解为深度，反射率，视角和照明。为了在无监督的情况下解构这些组件，作者使用了以下事实：许多对象类别至少在原则上具有对称结构。

作者通过光照的推理来利用底层对象的对称性，即使外观由于阴影而不对称。接着通过预测对称概率图来建模可能（但不一定）对称的对象，并与模型的其他组件联合起来进行端到端的学习。实验表明该方法可以从单视图图像中非常准确地恢复人脸，猫脸和汽车的3D形状，而无需任何监督或预先设定的形状模型。

人脸重建效果

论文：

https://arxiv.org/abs/1911.11130

代码：

https://github.com/elliottwu/unsup3d

项目主页：

https://elliottwu.com/projects/unsup3d/

（有Demo，可上传图片体验）

最佳论文一作Shangzhe Wu，是来自牛津大学视觉几何组的二年级学生，由 Andrea Vedaldi 教授指导获得了 Facebook 研究所的全额奖学金。在 HKUST 读本科期间，曾与Chi-Keung Tang教授和Yu-Wing Tai 教授合作研究图像翻译 / 生成，现在主要的研究方向为无监督 / 自监督的3D 理解。Shangzhe Wu曾于2017年11月 -2018年2月，在腾讯优图实验室做机器学习实习生。

最佳学生论文: BSP-Net: Generating Compact Meshes via Binary Space Partitioning

BSP-Net：通过二叉空间分割生成紧凑网络

这篇论文的角度十分新颖，从多边形网格入手，基于计算机图形学的经典空间数据结构Binary Space Partitioning（BSP）来设计了一个BSP-Net。这个网络可通过凸分解来学习表示3D形状，并且不受监督，因此训练不需要进行凸形分解。BSP-Net的重建质量有很大的优势，并且很容易能够进行参数设置。

论文一作是来自Simon Fraser University的博士一年级学生Zhiqin Chen，师从张皓教授，从事计算机图形学相关的研究，主要研究方向是几何建模和机器学习。Chen于2017年从上海交通大学本科毕业，于2019年从Simon Fraser University硕士毕业。

论文：

https://arxiv.org/abs/1911.06971

代码：

https://github.com/czq142857/BSP-NET-original

项目主页：

https://bsp-net.github.io/

此外，PAMI青年研究者奖的两位获得者是：Jon Barron & Deqing Sun

Deqing Sun本科毕业于哈尔滨工业大学电子与信息工程专业，后在香港中文大学获得硕士学位，并在布朗大学获得了博士学位。他曾是英伟达高级研究科学家，现为谷歌高级研究员。

经典论文奖，也授予了Deqing Sun，Stefan Roth和Michael J. Black的Secrets of Optical Flow Estimation and Their Principles，发表于2010年。

中国学者占四成！诺亚方舟实验室田奇位列华人高产榜榜首

从录取论文作者来看，中国学者的贡献在此届CVPR确实是熠熠生辉。

CVPR大会程序主席刘策公布，今年CVPR论文中国作者占CVPR 2020总作者总人数的39.2%，在各个国家中位列第一。

从大学/机构来看，来自清华大学的作者人数最多，排名第一。此外上海交通大学，北京大学，浙江大学贡献位居前10。

其中根据Aminer统计，来自华为诺亚方舟实验室的田奇位列华人榜首，共有24篇论文入选。

在一作华人学生榜单中，香港科技大学的周磊以5篇入选论文位列第一。

中国厂商展现实力，商汤62篇，华为、百度、腾讯、阿里表现不俗

在国内，包括百度、腾讯、旷视、华为、虎牙等在内的诸多国内科技公司，也纷纷战绩斐然。

国内公司论文入选情况：（如有遗漏，欢迎补充）

商汤科技及联合实验室共有62篇论文入选，其CVPR 2020录用论文在多个领域实现突破，包括对抗式生成模型、三维点云理解与分析、训练加速与模型量化、视频理解与分析、网络结构搜索等。

华为视觉研究团队此次为业界贡献了 34 篇论文，其中包括 7 篇oral论文。

3 百度共有22篇论文入选，比去年的17篇增加了5篇，有进步涉及主题涵盖人脸检测&识别、视频理解&分析、图像超分辨、及自动驾驶中的车辆检测、场景实例级分割等领域。

4 腾讯优图17篇论文入选，腾讯被收录的论文涵盖类比学习、人脸识别、物体检测、行人重识别等前沿领域等。

5 阿里巴巴共有16篇论文入选，涵盖3D视觉、目标检测以及频域图像处理等领域研究成果。

6 旷视今年入选16篇，比去年的14篇有进步，论文的作者中我们也看到了印奇、范浩强等熟悉的名字。

7 京东数科也中选了8篇，在去年中选7篇的数量上有所增加。

8 快手一共6篇，其中一篇一作，作者是罗切斯特大学的快手实习生Haichuan Yang，也是刘霁老师的学生。

9 虎牙也有1篇论文入选。

参会人数有所减少，论文作者和数量均大幅增加

相比去年，今年参会人数约为7000人，较去年有一定的减少。

超过3600评审审阅了超过1.8万稿件，工作量增加了21%。在此也向各位评审道一声辛苦了！

今年的resigtered和valid submissions均比去年有显著增长。

最终提交的有效论文数为5865篇，接收的论文数为1467篇，接受率仅为25%。入选的论文中，参加oral presentation的有335篇。

在如此激烈角逐下，获奖的论文能脱颖而出，足以体现论文的含金量之高。

下面的词云很直观的看出今年的CV领域的主流趋势。其中Transfer （learning）和Robotics可以看做是今年的两匹黑马了。

组委会成员

这届大会主席是 Gerard Medioni（南加州大学 & 亚马逊研究负责人，Amazon Go），Ramin Zabih（康奈尔大学）和 Terry Boult（科罗拉多斯普林斯分校）

Gerard Medioni

程序主席是刘策（谷歌 & MIT）、Greg Mori（加拿大西蒙弗雷泽大学），Kate Saenko（波士顿大学）和 Silvio Savarese（斯坦福大学）。

谷歌近70篇入选，实力霸榜

目前，谷歌已有近70篇论文在本届CVPR会议被接收，微软51篇，Facebook37篇，英伟达15篇全部入选。

谷歌在各家企业中拔得头筹，近70篇论文涵盖了计算机视觉许多热门领域，包括图像识别、神经网络、自动驾驶和语义分割等。

并且，谷歌将各类计算机视觉技术应用到实际的场景中，例如更新了Google Photos和Image Search中基于内容的搜索等。

谷歌就有一篇名为《RetinaTrack: Online Single Stage Joint Detection and Tracking》简述了如何进行车辆的多目标跟踪。该论文介绍了一种名为RetinaTrack的方法，通过对Waymo开放数据集的评估，证明了该方法在更少的计算量下能够很好的完成跟踪任务。