人工智能的中国式崛起

人工智能的中国式崛起

随着全球新一轮科技革命的兴起,大数据、云计算、人工智能、区块链等新技术加快推广应用,智慧物流已成主流,而人工智能是智慧物流不可缺少的技术手段。中国在人工智能领域也有许多尖端的企业,商汤科技是是其中一家有代表性的人工智能初创企业。其于图像处理、人脸辨识、自动驾驶、深度神经网络等方面具备深厚的技术积累。我们有幸邀请到商汤科技CEO徐立来给大家分享主题,人工智能的中国式崛起。

$徐立:谢谢菜鸟的邀请,谢谢主持人,有幸在这里跟大家来讲一讲,来之前对物流不是很了解,我自己对智能的理解我太太买东西快递就送家里,两种形态,一种有人接一种没人接,没有人接客服就很不客气就给我打电话,然后就给我放在我们家门口。然后一看签收人是我们家的门我就给我妈打电话,如果是人的话就知道有人收了。中国的物流做得比美国好多了,美国快递能在隔天到达已经很好了。$我们做什么事情?一好玩二好用,以前创业我妈非常关心我们,一打电话说你又胖了,每次打电话都是做这个主题,后来又一次说你们是做人工智能的?我说对,她说你们这个东西能不能毁灭人类?我们做的还是好玩、好用两块,好用是提高生产力,我们商汤科技一块收入是人工智能的工具,到2035年人工智能有望推动世界劳动生产率提高40%以上,为世界经济贡献15.7万亿。人工智能这一块生产力的提升非常大,主要是替代人,某种意义上现在的人工智能很大的帮助是于替代劳动力的事。$讲到生产力我自己认为发展路径有不同的阶段,第一个阶段叫技不如人,什么叫技不如人?我做了很多的人工智能的工具,算法上很厉害,干得不够好,好想你多了个助手但是它是猩猩,猩猩也能做点事但是不太爽,这是我们10、15年前人工智能不瘟不火,这个行业对垂直的业态影响很小,我们那个时候举例子人工智能,人工指导的智能,统计里面的统计也是人工指导的智能,这个模型是哪来的?就是先验。人工指导的智能不算智能,这个模板是人设计的,人给机器强加一些什么东西难以逃离人的思路,我们觉得做得非常人好,很多人不愿意用。$第二个就是超过普罗大众,人的这条线就是作为生产力必须要达到的,我做一个整齐汽车头比人跑得慢,觉得哪里怪怪的,现在叫大数据智能,就是大数据的知识可以赋予给人,现实中的内容可以通过标注传递给机器,普罗大众都可以干,这样我们可以大量地获取群众数据,用这个群众数据来促进这个行业的发展。所以这个叫超过普罗大众。而且在2010年之后恰巧有一个处理大数据的工具,叫深度学习,这两个东西一结合有可能效率高超过普罗大众,超过普罗大众作为市场工具很多人都可以用了。$第三个阶段是超越专家,我们去协和医院本着随便交流一下,他们觉得我们做人工智能觉得非常兴奋,觉得找到抓手了,他们说我们知不知道我们这里有两个老国宝快退休了,但是人家看肺片一看一个准,就是肺片的早期就知道有癌变的可能性,但是全中国就两个了,你们要不要搞一个人工智能的机器,我们医院就厉害了,我们说我们是大数据驱动,做一个任务百万级别的数据要的,你个拉医生一天能看几张片?所以算法的迭代,比如说其他不同方面对结核的搜索,用这种方法来形成超越专家的能力。$我觉得这是代表生产力的三种状态,第一种没有什么用处;第二个可以做到效率的提升;第三个可以作为服务的升级。什么叫服务的升级?就是本来没有的东西可以呈现给普罗大众,目前大部分都在第一个状态,少数过了一条线,我觉得现在发展空间还是有。$讲中国,中国这块我觉得三个大的点,一个政策扶持,第二行业需求肯定在,第三技术突破。$首先国务院发表《新一代人工智能发展规划》,我觉得在这方面对行业的影响很深远。中国的体系下技术突破第一个专利速度赶上美国,速度很快。$第二AI行业有一个代表性的论文,这是一个大杂烩的,相对代表AI的发展,31%是华人字的,也就是说这个领域里面中国人很多。讲到计算机视觉华人就更多了,去年的ACCV上面统计了一下40%是华人,我觉得单独视觉的领域华人参与更高。$我们平台是自己自建的平台,我们需要有自己的平台做不同任务的训练,比如说不同的视觉Google都可以做一些应用,这是我们自己的parrots系统,我们同样的任务Google1000多层就不行了,我们可以做1千、2千层,同时可以训练20亿的人脸数据,一周,所以整个过程还是非常有效,第三现场还可以做多模态的关联,所以自己的平台还是有一定的优势和价值。$同时我们视觉里面做得比较早,我们团队2011年开始做,2011、2013我们视觉领域的大部分工作都是用AI做的尝试。我们在公司成立之后我们计算一下我们在CVPR、ICCV这些机构我们排得多一些,包括我们今年CVPR44篇,我们其实并不鼓励员工发论文,但是国内的优势是会面临一些,其实连美国都面临不到的新的问题,这么大数据、场景定义新问题本身就比较先进。 这一块是我们具备了人工智能的眼光。$第三是技术突破,技术突破先进的地方好玩的是想象力,这是我们自己做的文章,白色的胸部、浅灰色的头部、黑色的头部可以生成这样的鸟,这都是假的,这是换了红色来做,可以有衍生空间,生成素材,你在编辑里面不是直接搜索,是直接生成,这是我们的酸法生成的数据,大家可以看看这里面有哪些是真的,其实这里面有一张照片是真的,其他照片都是假的生成的,最右边的那张照片是真实的,其他都是算法生成的,用不同的描述生成鸟、花,这种算法还是很有意思的。$有了技术突破看应用场景,应用场景讲到衣食住行都有突破,刚才生成鸟、花,现在可以生成毛衣、衣服,我讲一句话就可以让人变装,这个家里就不需要那么多衣服了,我觉得我太太买衣服就穿一次,镜子面前看一看就行了。然后卡路里这个东西,说生成一个APP,吃饭的时候照一下节食,这个APP面对美食的瞬间拿出APP拍一拍不想吃,某种程度上反人类,但是很有意思。$住呢也很有意思,我们办公室很简单靠脸刷,我的办公室也有很多同样的屏,来的人都亮了,没有来的人都暗了,可以看到谁来谁没来,我们老板很喜欢。右边是我们用的闸机,你完全感觉不到,这个变化也很大。行就是自动驾驶,我们这边杭州看到无人车都是我们提供的无人车的引擎。$视觉预测,商汤科技做的是无人视觉,成像、感知、识别、理解,你拍照到拍照后面的识别都要干,什么叫计算机识别?我拿读书的时候的例子看一下,这是一张照片,照片很小你看不清,是开心的还是不开心的?看不清大家都知道这个脸是开心的还是不开心的?开心的,看清楚大家都知道是开心的很厉害,但是你把它放大她是不开心的,她本身确实能让人看混,当然这个寿命整个计算机视觉解决什么问题呢?像素的识别以及整个图片的看法。这个例子是把两个不同频率的信号混在一起,小的时候你可以看到低频,放大可以看到高频信息,可以造一些让你很困惑的东西。$这张讲到看清,我们做很多视觉的问题要超越视觉那条线,超越普通人。这是早期的看清世界里面看清这件事情,这张照片比较了的十年前,为什么拿这张照片?因为是我自己做的,这个是什么城市?满不清,讲得多了大家知道是多伦多,看得清右边的字吗?看不清,机器可以看清,还有多张照片的恢复也非常好。$再讲一个简单的例子计算机搞艺术,这是我们计算机在好几年前做的第一个计算机做画的事情,这是一个例子,和网上比什么样,我们搜埃菲尔铁塔是这样,我同事说当然是人画的得。我搜出来一幅画是这样,草坪上人不知道干吗,国旗也不太对,这个画很出名,我们机器画的是这样,机器学某中风格画画。机器可以替代人做很多事情,再往下眼神仆役生成各种各样的效果,莫奈、梵高等等,大家想要收集名画的话可以发过来,我们提供名画的“制作”。$这个其实是近大远小的场景,有人看不清,机器可以看清楚,我们可以通过机器做景深的效果。$前面讲的是图像处理看的部分,我们接下来讲看懂,这是一个很重要的例子,人脸识别这是谁是一个可解释的说法,这个电影《谍影重重》,你看本身是左边的照片,用算法变成右边的样子了,这是FBI给我们指出一条很有意思的路。这个算法能不能做?我们希望把左边的照片变成右边的样子,机器知道是这个样子的,给警察一个照片就去抓,负责你这样子认为是他不合适。这个也有大数据的算法做,相当于一个一个数据贴,也能把人脸做清楚,做出来是这样子,按照模板把人脸贴清楚了,也变清楚了,总感觉哪里不太对,比如说给你右边的情况,电脑生成了左边的程度,有点难度,警察不是抓这个人,是抓我们。$这个事情有应用场景吗?这个事情一开始做有一大堆的需求,就是有一个公司waifu2x,这个拼音读快一点就是太太,他们把太太放大两倍,做什么呢?把传统的日本的老照片扫描进去搞清放大很多倍,这个应用很常见,保留原有人的识别。这个推特2015、2016年都在发这个文章,我们一直做到2008年一直在做,不同程度的点。我们现在能做成什么样子呢?这张图品就形成这样的结果,这个照片就艺术上的结果,事实上能不能用?我们在实际当中真的可以把照片恢复出来给公安一些信息。最右边可以看一个很模糊的比对,特别有意思的场景。$最后讲一个例子,这是深圳的文博会,我们在文博会上五天抓了25个重要的逃犯很厉害。我突然就想文博会卖书的,重要的逃犯都去卖书,回头跟我们同事说人家都这么热爱文化,你们也要学习。$前段时间发布会搞一个有意思的东西,我们做不仅是瘦身、美颜、拉长身,这个很有意思,这个我们做出来大家可以多玩一下。我们说自己是赋能百业,我们希望利用自己的一些技术,与大家一同协作、共赢。$主持人:感谢徐总。我们从徐总的演讲中了解到了中国在人工智能领域的创新实力,人工智能在物流行业的运用之一就是物流机器人。接下来演讲的是刘云辉教授,刘云辉教授主要从事机器人、自动化技术和信息科学等领域的研究工作,是国际知名机器人和自动化技术专家,国际电子电机工程师协会(IEEE)高级会员,日本机器人学会会员,中国自动化学会机器人专业委员会常务理事,机器人和自动化领域国际权威杂志IEEE机器人与自动化(IEEE Transactions on Robotics and Automation) 编委。今天很荣幸邀请到刘云辉教授给我们分享物流机器人的新进展。

徐立:谢谢菜鸟的邀请,谢谢主持人,有幸在这里跟大家来讲一讲,来之前对物流不是很了解,我自己对智能的理解我太太买东西快递就送家里,两种形态,一种有人接一种没人接,没有人接客服就很不客气就给我打电话,然后就给我放在我们家门口。然后一看签收人是我们家的门我就给我妈打电话,如果是人的话就知道有人收了。中国的物流做得比美国好多了,美国快递能在隔天到达已经很好了。

我们做什么事情?一好玩二好用,以前创业我妈非常关心我们,一打电话说你又胖了,每次打电话都是做这个主题,后来又一次说你们是做人工智能的?我说对,她说你们这个东西能不能毁灭人类?我们做的还是好玩、好用两块,好用是提高生产力,我们商汤科技一块收入是人工智能的工具,到2035年人工智能有望推动世界劳动生产率提高40%以上,为世界经济贡献15.7万亿。人工智能这一块生产力的提升非常大,主要是替代人,某种意义上现在的人工智能很大的帮助是于替代劳动力的事。

讲到生产力我自己认为发展路径有不同的阶段,第一个阶段叫技不如人,什么叫技不如人?我做了很多的人工智能的工具,算法上很厉害,干得不够好,好想你多了个助手但是它是猩猩,猩猩也能做点事但是不太爽,这是我们10、15年前人工智能不瘟不火,这个行业对垂直的业态影响很小,我们那个时候举例子人工智能,人工指导的智能,统计里面的统计也是人工指导的智能,这个模型是哪来的?就是先验。人工指导的智能不算智能,这个模板是人设计的,人给机器强加一些什么东西难以逃离人的思路,我们觉得做得非常人好,很多人不愿意用。

第二个就是超过普罗大众,人的这条线就是作为生产力必须要达到的,我做一个整齐汽车头比人跑得慢,觉得哪里怪怪的,现在叫大数据智能,就是大数据的知识可以赋予给人,现实中的内容可以通过标注传递给机器,普罗大众都可以干,这样我们可以大量地获取群众数据,用这个群众数据来促进这个行业的发展。所以这个叫超过普罗大众。而且在2010年之后恰巧有一个处理大数据的工具,叫深度学习,这两个东西一结合有可能效率高超过普罗大众,超过普罗大众作为市场工具很多人都可以用了。

第三个阶段是超越专家,我们去协和医院本着随便交流一下,他们觉得我们做人工智能觉得非常兴奋,觉得找到抓手了,他们说我们知不知道我们这里有两个老国宝快退休了,但是人家看肺片一看一个准,就是肺片的早期就知道有癌变的可能性,但是全中国就两个了,你们要不要搞一个人工智能的机器,我们医院就厉害了,我们说我们是大数据驱动,做一个任务百万级别的数据要的,你个拉医生一天能看几张片?所以算法的迭代,比如说其他不同方面对结核的搜索,用这种方法来形成超越专家的能力。

我觉得这是代表生产力的三种状态,第一种没有什么用处;第二个可以做到效率的提升;第三个可以作为服务的升级。什么叫服务的升级?就是本来没有的东西可以呈现给普罗大众,目前大部分都在第一个状态,少数过了一条线,我觉得现在发展空间还是有。

讲中国,中国这块我觉得三个大的点,一个政策扶持,第二行业需求肯定在,第三技术突破。

首先国务院发表《新一代人工智能发展规划》,我觉得在这方面对行业的影响很深远。中国的体系下技术突破第一个专利速度赶上美国,速度很快。

第二AI行业有一个代表性的论文,这是一个大杂烩的,相对代表AI的发展,31%是华人字的,也就是说这个领域里面中国人很多。讲到计算机视觉华人就更多了,去年的ACCV上面统计了一下40%是华人,我觉得单独视觉的领域华人参与更高。

我们平台是自己自建的平台,我们需要有自己的平台做不同任务的训练,比如说不同的视觉Google都可以做一些应用,这是我们自己的parrots系统,我们同样的任务Google1000多层就不行了,我们可以做1千、2千层,同时可以训练20亿的人脸数据,一周,所以整个过程还是非常有效,第三现场还可以做多模态的关联,所以自己的平台还是有一定的优势和价值。

同时我们视觉里面做得比较早,我们团队2011年开始做,2011、2013我们视觉领域的大部分工作都是用AI做的尝试。我们在公司成立之后我们计算一下我们在CVPR、ICCV这些机构我们排得多一些,包括我们今年CVPR44篇,我们其实并不鼓励员工发论文,但是国内的优势是会面临一些,其实连美国都面临不到的新的问题,这么大数据、场景定义新问题本身就比较先进。 这一块是我们具备了人工智能的眼光。

第三是技术突破,技术突破先进的地方好玩的是想象力,这是我们自己做的文章,白色的胸部、浅灰色的头部、黑色的头部可以生成这样的鸟,这都是假的,这是换了红色来做,可以有衍生空间,生成素材,你在编辑里面不是直接搜索,是直接生成,这是我们的酸法生成的数据,大家可以看看这里面有哪些是真的,其实这里面有一张照片是真的,其他照片都是假的生成的,最右边的那张照片是真实的,其他都是算法生成的,用不同的描述生成鸟、花,这种算法还是很有意思的。

有了技术突破看应用场景,应用场景讲到衣食住行都有突破,刚才生成鸟、花,现在可以生成毛衣、衣服,我讲一句话就可以让人变装,这个家里就不需要那么多衣服了,我觉得我太太买衣服就穿一次,镜子面前看一看就行了。然后卡路里这个东西,说生成一个APP,吃饭的时候照一下节食,这个APP面对美食的瞬间拿出APP拍一拍不想吃,某种程度上反人类,但是很有意思。

住呢也很有意思,我们办公室很简单靠脸刷,我的办公室也有很多同样的屏,来的人都亮了,没有来的人都暗了,可以看到谁来谁没来,我们老板很喜欢。右边是我们用的闸机,你完全感觉不到,这个变化也很大。行就是自动驾驶,我们这边杭州看到无人车都是我们提供的无人车的引擎。

视觉预测,商汤科技做的是无人视觉,成像、感知、识别、理解,你拍照到拍照后面的识别都要干,什么叫计算机识别?我拿读书的时候的例子看一下,这是一张照片,照片很小你看不清,是开心的还是不开心的?看不清大家都知道这个脸是开心的还是不开心的?开心的,看清楚大家都知道是开心的很厉害,但是你把它放大她是不开心的,她本身确实能让人看混,当然这个寿命整个计算机视觉解决什么问题呢?像素的识别以及整个图片的看法。这个例子是把两个不同频率的信号混在一起,小的时候你可以看到低频,放大可以看到高频信息,可以造一些让你很困惑的东西。

这张讲到看清,我们做很多视觉的问题要超越视觉那条线,超越普通人。这是早期的看清世界里面看清这件事情,这张照片比较了的十年前,为什么拿这张照片?因为是我自己做的,这个是什么城市?满不清,讲得多了大家知道是多伦多,看得清右边的字吗?看不清,机器可以看清,还有多张照片的恢复也非常好。

再讲一个简单的例子计算机搞艺术,这是我们计算机在好几年前做的第一个计算机做画的事情,这是一个例子,和网上比什么样,我们搜埃菲尔铁塔是这样,我同事说当然是人画的得。我搜出来一幅画是这样,草坪上人不知道干吗,国旗也不太对,这个画很出名,我们机器画的是这样,机器学某中风格画画。机器可以替代人做很多事情,再往下眼神仆役生成各种各样的效果,莫奈、梵高等等,大家想要收集名画的话可以发过来,我们提供名画的“制作”。

这个其实是近大远小的场景,有人看不清,机器可以看清楚,我们可以通过机器做景深的效果。

前面讲的是图像处理看的部分,我们接下来讲看懂,这是一个很重要的例子,人脸识别这是谁是一个可解释的说法,这个电影《谍影重重》,你看本身是左边的照片,用算法变成右边的样子了,这是FBI给我们指出一条很有意思的路。这个算法能不能做?我们希望把左边的照片变成右边的样子,机器知道是这个样子的,给警察一个照片就去抓,负责你这样子认为是他不合适。这个也有大数据的算法做,相当于一个一个数据贴,也能把人脸做清楚,做出来是这样子,按照模板把人脸贴清楚了,也变清楚了,总感觉哪里不太对,比如说给你右边的情况,电脑生成了左边的程度,有点难度,警察不是抓这个人,是抓我们。

这个事情有应用场景吗?这个事情一开始做有一大堆的需求,就是有一个公司waifu2x,这个拼音读快一点就是太太,他们把太太放大两倍,做什么呢?把传统的日本的老照片扫描进去搞清放大很多倍,这个应用很常见,保留原有人的识别。这个推特2015、2016年都在发这个文章,我们一直做到2008年一直在做,不同程度的点。我们现在能做成什么样子呢?这张图品就形成这样的结果,这个照片就艺术上的结果,事实上能不能用?我们在实际当中真的可以把照片恢复出来给公安一些信息。最右边可以看一个很模糊的比对,特别有意思的场景。

最后讲一个例子,这是深圳的文博会,我们在文博会上五天抓了25个重要的逃犯很厉害。我突然就想文博会卖书的,重要的逃犯都去卖书,回头跟我们同事说人家都这么热爱文化,你们也要学习。

前段时间发布会搞一个有意思的东西,我们做不仅是瘦身、美颜、拉长身,这个很有意思,这个我们做出来大家可以多玩一下。我们说自己是赋能百业,我们希望利用自己的一些技术,与大家一同协作、共赢。

主持人:感谢徐总。我们从徐总的演讲中了解到了中国在人工智能领域的创新实力,人工智能在物流行业的运用之一就是物流机器人。接下来演讲的是刘云辉教授,刘云辉教授主要从事机器人、自动化技术和信息科学等领域的研究工作,是国际知名机器人和自动化技术专家,国际电子电机工程师协会(IEEE)高级会员,日本机器人学会会员,中国自动化学会机器人专业委员会常务理事,机器人和自动化领域国际权威杂志IEEE机器人与自动化(IEEE Transactions on Robotics and Automation) 编委。今天很荣幸邀请到刘云辉教授给我们分享物流机器人的新进展。

猜你喜欢

转载自blog.csdn.net/weixin_42480782/article/details/80794979