百度杨睿刚:自动驾驶要数据,可数据从哪来?

年华已去八载,实力宜加剧!中国数据库技术大会(DTCC)已连续举办八届,其主办方ITPUB社区也即将步入成年。一春一秋一变革,一载一世一突破,虽每年都聚焦数据库及大数据领域,但DTCC总会加入不少热点技术话题的讨论。对于时下火热的自动驾驶,DTCC怎会放过呢?

640

2018年3月,百度获得首批自动驾驶牌照。此后,百度在自动驾驶领域动作频频,开放大规模自动驾驶数据集ApolloScape、无人驾驶巴士“阿波龙”正式面向公众试乘、首届Apollo Scape学术峰会召开、正式发布Apollo 2.5版本......对于一路前行的百度而言,想要做好自动驾驶,什么才是最重要的?不同的自动驾驶研发选型方式,百度更倾向于哪一种?频频爆出的安全问题,百度有合适的解决方案吗?对于何时量产,百度的规划是什么呢?

本文采访对象:杨睿刚,百度三维视觉首席科学家,机器人和自动驾驶实验室负责人,本届(第九届)DTCC大会主会场演讲嘉宾。

640
▲杨睿刚

要想做好自动驾驶,什么才是最重要的?

很多人经常会说:数据是AI的燃料。确实,数据在自动驾驶领域的重要性不言而喻,尤其是国内自动驾驶起步较晚,缺乏合理有效的数据集进行训练。当然,国内大部分布局自动驾驶的企业并不是缺乏对数据重要性的认知,而是缺乏数据获取渠道。曾经,百度面临同样的问题,现在又是如何解决的呢?

作为类度量工具,杨睿刚认为数据集的作用就好比尺子,当我们需要丈量1厘米的物体,那至少需要达到1毫米的精度,也就是说度量工具一定要比待测物体更精确。因此,百度采用目前最好的方式——三维移动扫描车收集数据,通过三维打造毫米级的精度,定位系统也可达到目前全球较高的厘米级精度。通过上述设备,百度成功获得了二维和三维数据,通过自研工具完成数据标注,获得了快速大量生产精准数据的能力。

今年3月份,百度开放了大规模自动驾驶数据集ApolloScape,当时最引人注意的恐怕就是超Cityscapes等同类数据集10倍以上的数据量。根据杨睿刚的介绍,ApolloScape还有两大过往数据集不具备的特征,一是带有精准三维信息;二是首个视频数据集,实现标注连续。

虽然国外有不少可供选择的数据集,但是国内的路况复杂程度显然与国外不同。虽然我们也经常可以听到一些企业宣布其自动驾驶汽车开始公测,但大多数测试都是在较简单的路况下进行的,在复杂路况下,自动驾驶还远远达不到上路标准,这其中的很多问题仅依靠技术手段很难解决,需要大规模精准数据集的帮助,这也是百度决定开放ApolloScape的初衷。百度希望通过公开的方式,吸引更多企业和开发者利用并补充数据集,进而提高自动驾驶的感知能力。

对于不同自动驾驶研发的选型方案,百度如何选择?

在国内,百度算得上自动驾驶领域的先行军,无章可循,从无到有建立科研团队,百度这一路攻坚克难的走上来,又有哪些经验可以分享呢?

谈及此,杨睿刚谦虚得表示,对于入局这个领域的企业而言,或许也没什么有价值的经验可以分享,但还是想提醒局中人,自动驾驶是一个非常庞大的系统工程,环环相扣,中间任何一个环节出现差错,整个系统都会崩盘。目前比较主流的两种选型方式,一是激光雷达与传感器的融合;二是利用计算机视觉,使用摄像头的方式。前者属于主动探测,但成本较高;后者成本低,但无法保证全天候、全环境下百分百的工作状态,百度倾向于第一种方式,并相信随着技术的发展,前者的成本会呈现下降趋势。

面向未来,百度对量产的规划与期望是什么?

对于炒了这么久的自动驾驶,公众最关心的问题之一就是何时量产,当然,这个量产是有条件的,真正的自动驾驶应该是不受环境限制、不受天气约束、不需人类干预的。

在这个前提下,安全性是所有自动驾驶企业必须放在首位要解决的问题。通过数据集全面提高感知能力可以在一定程度上解决部分安全问题,但并不全面。百度在Apollo平台一周年时宣布正式成立Apollo汽车信息安全实验室。百度副总裁、智能驾驶事业群组总经理李震宇现场表示,自动驾驶落地的真正要素是切实做到安全第一,这也是百度自动驾驶的准则。

640
▲阿波龙在百度世界大会上正式亮相

同一天,百度发布了Apollo 2.5版本,该版本已经开放在限定区域内基于视觉的高速自动驾驶能力。回顾整个Apollo 1.0到2.0,从最初简单的封闭场地循迹自动驾驶能力到固定车道自动驾驶能力,再到简单城市路况下的自动驾驶能力和封闭高速路段的场景,自动驾驶汽车的量产步伐似乎在加快。即便一直在前行且百度无人驾驶巴士“阿波龙”量产在即,但杨睿刚表示,要想达到真正的不受环境、天气和场景限制的自动驾驶还需要很长一段路要走,百度会借助产品形式和量产计划向外部证明,百度一直在砥砺前行......

640

寥寥数语尚道不尽百度在自动驾驶领域的步步为营,作为本届DTCC大会主会场的演讲嘉宾,杨睿刚将现场分享主题为《自动驾驶研究的开放数据集和工具以及百度研究开放存取数据集》的演讲。如果志同道合,不妨现场来撩!(点击下方“阅读原文”,即可进入DTCC大会快速通道)

640

猜你喜欢

转载自blog.csdn.net/bfblw5bvh89l5kztqru5/article/details/80248527