CNCC2019第二天 | 从互联网、数据可视化、深度学习到AI,智能+社会还有多远

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/duxinshuxiaobian/article/details/102694136

640?wx_fmt=jpeg

上有天堂下有苏杭,你和大佬只差一扇窗。没错,这扇窗就是计算机工作者们的年度狂欢盛会——CNCC。 姑苏城外,金鸡湖畔,桂花怒放,满城飘香。金秋时节,CNCC2019如期而至,于10月17~19日和大伙相约苏州金鸡湖国际会议中心。会议由CCF主办,苏州工业园区管委会承办。小芯作为CCF官方合作媒体,前来“取经”。

全文共6745字,预计学习时长15分钟
640?wx_fmt=jpeg
上回,论坛伊始,小芯和大家一起见证了群英荟萃,煮酒论“智能”。 此时,小芯掐指一算,已知: 本次大会的主题是“智能+引领社会发展”,嗯,差不多该讲讲“智能+社会”了。
 
料事如神非小芯莫属(手动狗头),这不,大会第二天,众多大咖齐聚一堂,共同商议“国家大事”——“智能+各领域的发展现状及其如何引领社会发展”。
 
640?wx_fmt=jpeg
吴建平:划重点,推进路由控制达到全网最优很重要

640?wx_fmt=jpeg
清华大学吴建平

第一位闪亮登场的嘉宾是清华大学计算机系主任、中国工程院院士、英国皇家工程院外籍院士吴建平教授,他给我们带来的是“互联网体系结构的演进、创新和发展”。
 
吴建平教授表示,互联网经过50年的发展,已经成为当今社会最重要的信息基础设施,也是人类历史上最伟大的技术发明之一。互联网体系结构定义互联网各部分的组成及其相互关系,是互联网的最核心关键技术,是剖析和研究互联网各部分功能组成及其相互关系网络层承上启下保证全网通达的核心,在互联网的演进和发展过程中扮演了十分重要的角色。
 
互联网体系结构的核心是网络层。但随着传送格式由 IPv4 演进到 IPv6、转发方式实现了无连接存储转发,在分组传送格式和(无连接存储转发)转发方式相对稳定的情况下,其路由选择技术不断演进和创新,以满足互联网通信和应用需求的不断变化。为了推进IPv6 下一代互联网体系结构及其与未来互联网体系结构的演进和创新,就必须解决互联网在扩展性、安全性、高性能、实时性、移动性等方面的技术挑战。
 
因而在这种情况下,推进路由控制不断满足通信和应用发展需求(复杂多变量)达到全网最优成为了互联网研究的重大科学难题。
 
640?wx_fmt=jpeg
李晟瑍:通过深度学习赢得策略游戏

640?wx_fmt=jpeg

韩国高丽大学李晟瑍

接着出场的是韩国高丽大学校人工智能系主任教授、韩国科学技术翰林院院士、IEEE Fellow 李晟瑍(Seong-Whan Lee),他基于其研究工作——人工智能冰壶机器人系统“Curly”给大家带来了深度强化学习方面的报告,报告题目是“深度强化学习:现实中的回合制策略游戏”。
 
首先,他对冰壶策略游戏进行了科普:冰壶策略游戏是奥运会的一个比赛项目,选手需要在冰面上将石球向中心位置投掷,被称作「冰上国际象棋」。而人工智能冰壶机器人系统通过寻找到最优策略来完成比赛,整体来看包括四个部分:
 
第一部分是理解博弈状态,即识别出石球每移动一次的实施运动轨迹;

第二部分是构建匹配的大数据,即收集和学习与最优化策略匹配的大数据;
第三部分是真实模拟,即基于石球的碰撞、磨蹭以及冰面的情况来进行真实模拟;
第四部分则是规划最优策略,即基于 DNN 和 MCTS 算法来解决不确定性问题以实现策略最优化。
 
并通过演示人工智能冰壶机器人系统“Curly”在真实的冰壶赛场上的比赛视频,展现了「Curly 」系统的三个优越性能:

  • 基于 AI 的冰壶策略和模拟引擎能够考虑冰面的高度不确定性;
  • 抛掷型机器人可通过牵引力控制实现自动驱动;
  • 跳跃型机器人基于视觉技术能够识别冰壶场地以及石球在场地上的整体布局。
 
无论是在传统的游戏模拟环境,还是真枪实战,与人类对手对抗(排名第一的韩国女子冰壶队),系统表现都令人拍手称赞。
 
640?wx_fmt=jpeg
徐扬生:做机器人要有爱,不能太功利

640?wx_fmt=jpeg

香港中文大学(深圳)首任校长徐扬生

中国工程院院士、香港中文大学(深圳)首任校长徐扬生教授紧随其后,给我们带来主题为“智能机器人研究:问题和思考”的报告。
 
距离徐扬生上次参加CCF 组织活动已有26年之久,激动之情溢于言表。他表示今天将结合自己在机器人领域 35 年的研究经历,努力为大家分享一些研究感悟和有价值的事,其中报告中提及的问题大多数都是机器人领域目前尚未解决的问题,希望能够为大家提供一些可以做研究的课题。
 
首先就什么叫“智能机器人”,他给大家做了详细的科普。在过去的 30 多年时间里,机器人领域的研究有 85%-90% 都集中在行为方向,另外的 5-15% 左右集中在感知和认知方向,而操作、移动以及抓取等都属于行为的研究范畴。现在,机器人的定义综合了早期多个研究范畴:感知+认知+行为。
 
“很多人问我,这些机器人有什么用,我的回复是,我的大多数机器人做出来都是没用的,我主要是兴趣驱动,但是做出来以后一部分有用一部分没有用,科研就是不能太功利的。”基于研究成果,如爬树机器人、驯服宠物的机器人、在软性物体上爬行的机器人、书法机器人以及全方位自动驾驶,徐扬生继续分享了自己在机器人研究中所面临的一些挑战和启发。
 
接下来,在“智能为何表现得如此无知,而多数研究都集中在行动”这一问题上,徐扬生表示:大家往往都认为行动才是最基本的,然而实际上智能才是最基本的。以人类为例,人体中最核心的器官就是心脑,抽象来说就是智能,机器人亦如此,智能发挥着决定性的作用。
 
那智能来自哪里?众所周知来自于学习。学习来自哪里?普遍认为来自算法神经。那么神经又来自哪里呢?徐扬生认为来自人类行为。机器人目前主要依赖算法,而他认为,机器人其实更应该通过人类行为、自然界学习来完成升级。
 
最后,徐扬生还分享了“机器人的学习能力实现到什么样的程度可以通用化?”、“应该研究动态还是静态机器人?难点在哪?”等一系列问题的个人观点,完整展示自己对于智能机器人的深入研究。
 
640?wx_fmt=jpeg
肖京:我们不仅仅卖保险,还专注人工智能
 

640?wx_fmt=jpeg

平安集团首席科学家肖京

接下来登场的是三位是企业嘉宾,他们从企业角度出发,发出了智能+社会创新性的声音。
 
卡耐基梅隆大学博士、平安集团首席科学家肖京首当其冲,基于平安对智能化技术的研发及应用实践,分享了企业对于智能化大数据分析挖掘在金融业务应用方面的探索。他的报告主题是“智能化金融战略—探索与实践”。
 
他表示,随着人工智能技术近期的飞速进步,“智能 +”逐渐取代了“互联网+”成为科技创新的主旋律。智能技术的应用建立在大数据基础之上,二者的紧密结合正在为传统行业带来巨大的变革。
 
但,相对于互联网+,智能+更加复杂,前者互联网只是模式的创新,相对容易实现;而后者则是技术上的创新,需要具备数据、技术(算法和算力)、场景和行业专家四大要素,让业务流程的每个环节都实现智能化。
 
作为天生数据化的金融领域,智能化更是必然的选择。而作为金融领域的领军企业,平安在行业内更是率先开展智能认知技术的研发及应用,在众多金融及医疗业务场景中取得了领先的成果,并提炼出了三步走战略:
 
第一阶段是婴儿阶段,即形成包括听觉、视觉、阅读理解能力在内的基础认知;
 
第二阶段是学习阶段,即构建海量信息和知识图谱的全面知识体系;
 
第三阶段是专家阶段,即能够具备打造专业解决方案的能力,能够让 AI 赋能金融服务、医疗、智慧城市等行业应用场景。
 
论述三个阶段时,他还结合了平安的一些实际案列,极具说服力。
 
最后,他还表示了平安目前对于 AI 伦理问题的极大关注,不仅积极参与各大部委对于 AI 伦理的标准制定,还专门成立了平安人工智能伦理委员会,创建了一套完整的体系来保证 AI 不会被滥用。
 
640?wx_fmt=jpeg
张博:拼车是解决交通拥堵非常有效的方式
 

640?wx_fmt=jpeg

滴滴出行联合创始人张博

接下来的嘉宾是滴滴出行联合创始人、首席技术官、自动驾驶 CEO 张博,他立足于滴滴「AI for Transportation」的科技战略,带来了关于“AI 引领出行变革”的报告。
 
首先他分享了滴滴成立的初衷,很简单,就是解决出租车司机和乘客的痛点:一方面,出租车司机大约 30% 的时间和燃油都花费在寻找乘客的过程中,同时也带来了交通拥堵、尾气排放等一系列问题;而另一方面,乘客也需要走到路边花时间去拦车。
 
过去20年的时间,互联网和移动互联网已经基本上解决信息的流动问题,而在未来,滴滴希望解决的是物理世界的人和物体的流动。在他看来,未来交通将会在三个层面发生变革:
 
最下一层:交通基础设施;
中间一层:车辆交通工具本身的变革,电动汽车和智能驾驶将是趋势;

最上一层:共享出行网络,越来越多的人会从拥有车,变成共享,而共享的颗粒度会从车的维度降维到座位,拼车将会是解决交通拥堵非常有效的方式。
 
基于这三层结构,张博现场还展示了滴滴的AR实景导航功能,重点介绍了滴滴在共享出行和智能驾驶方面所取得的一些进展和成果。
 
在共享出行方面,通过在计算机视觉定位和三维场景构建等方面进行技术创新,滴滴已经在深圳机场、郑州机场、等一些机场、火车站和大型商场上线AR导航功能,帮助网约车乘客更好地抵达上车点。且有较强的供需预测能力,对未来 15 分钟的供需预测的准确率达到 85%,从而对司机进行最佳调度和派单,提高匹配效率,优化系统。
 
在智慧交通方面,目前滴滴已与全国二十多个城市开展智慧交通项目合作,对全国超过2000个路口的信号控制参数进行了优化,平均降低了10%-20%的拥堵。
 
在智能驾驶方面,滴滴能够聚合其在科技、数据和运营方面已经积淀下来的优势来实现智能驾驶的目标。
 
CNCC2019期间,滴滴还集中展示了滴滴在出行领域的AI布局、解决方案和落地产品,包括智能派单、供需预测技术、滴滴城市交通大脑及自动驾驶测试车等。
640?wx_fmt=jpeg
王海峰:深度学习平台的建设,是实现“智能+”的必经之路
 

640?wx_fmt=jpeg

百度集团首席技术官王海峰

第三位企业嘉宾是百度集团首席技术官王海峰,他的主题是“深度学习平台支撑产业智能化”,立足深度学习框架核心技术,介绍了深度学习开源开放平台的技术和应用现状,并探讨了深度学习平台在产业智能化中的核心支撑作用和发展前景。
 
他表示:我们经历过三次工业革命,在对历史的回顾中,不难发现驱动工业革命的核心技术具有很强的通用性。虽然某项技术一开始可能起于某一行业,但最终会应用到人类生产、生活的方方面,并推动社会进入工业大生产的阶段。而这种工业大生产阶段具有标准化、自动化和模块化三大特点。
 
当下我们正处在第四次工业革命的开端,而人工智能则是科技和产业变革的核心驱动力量,而深度学习则是新一代人工智能浪潮中的核心基础技术。发展以自主可控的深度学习框架为核心的深度学习平台,对于繁荣人工智能产业、推动各行各业智能化升级、促进社会经济进步具有重要作用。
 
他将推动人类社会逐渐步入智能时代所要经历的三个典型阶段概括为:人工规则,机器学习,深度学习。并以 OCR 技术和机器翻译为例,阐述了深度学习对于人工智能任务所带来的革命性变化,具有很强的通用性,可以解决诸如SVM、CRF等模型所面对的问题。与此同时,深度学习作为智能时代的操作系统,能够向下对接芯片实现整体优化,向上承接各种应用将技术落地到实际场景,处于一个非常核心的位置。
 
然而,目前深度学习大规模产业化也面临来自开发、训练和部署方面的挑战——实现起来很复杂,开发效率很低。针对这几个方面,百度开发了深度学习平台“飞桨”PaddlePaddle。并且具备标准化、自动化、模块化的工业大生产特征,
 
飞桨底层的核心框架包括开发、训练、预测。开发既可以支持动态图,也可以支持静态图;训练可以支持大规模的分布式训练,也可以支持这种工业级的数据处理;同时可以有不同版本部署在服务器上、在端上,以及做非常高效的压缩、安全加密等等。核心框架之上有很多基础模型库,比如说自然语言处理的基础模型库、计算机视觉的基础模型库等等。同时也会提供一些开发的套件,再往上会有各种工具组件,比如说网络的自动训练、迁移学习、强化学习、多任务学习等等。此外,为了真正支撑各行各业的应用,我们提供很多使用者不需要理解底层这些技术、可以直接调用的服务平台。比如EasyDL,就是可以定制化训练和服务的,基本上可以不用了解深度学习背后的原理,零门槛就可以用它来开发自己的应用;AI Studio则是一个实训平台,很多大学也在用这样的平台上课、学习;当然,还包括端计算模型生成平台。
 
此外,还在农业如水培蔬菜智能种植、工业如精密零件智能分拣以及社会公益等实际场景的智能化应用中发挥了支撑性的作用。
 
640?wx_fmt=jpeg
俞士纶:数据挖挖挖,不仅要深,还要广
 

640?wx_fmt=jpeg

美国伊利诺大学芝加哥分校俞士纶

接下来上场的是数据挖掘领域巨擘,美国伊利诺大学芝加哥分校俞士纶教授,基于近期的研究,他为大家带来了“Broad Learning:A New Perspective on MiningBig Data”(广度学习:大数据挖掘的新视角)的分享。
 
他表示,大数据时代并非量大,而是种多,除了深度学习,咱们还需要广度学习,做到融合各类数据,挖掘更多信息,具体来说,可以分三步走:
 
第一步,定义并获取相关的有用数据源,即找到对你的问题有用的数据;
 
第二步,设计一种模型来将异质数据源信息融合起来;
 
第三步,基于模型整体的需求从各种数据源中深度地去挖掘信息。
 
从具体的技术路线角度来看,俞士纶认为广度学习的类型大致可以分为三类:
 
第一类,在同一个实体上有不同类型信息的学习,即某一实体可能存在文本、图片、音频、链接等不同类别的数据,这种类型的广度学习包括多视角学习、多源学习和多模态学习等(Multi-view Learning、Multi-source Learning、Multi-model Learning)。
 
第二类,在不同的但类型相似的实体上信息的学习。如迁移学习(Transfer Learning),比如说某一实体的数据太少,而另一实体的训练数据较多的话,就可以将数据更多的一方的数据迁移到数据较少的一方。
 
第三类,在有复杂网络类型关系的不同类型实体信息的学习。这包括基于融合的异质信息网络(HIN)。
 
其中,对于广度学习,最为关键的任务主要有两个:信息融合和知识发现。
 
从而对应的就有两个基本的挑战:一、发现什么数据是有用的,如何将这些数据融合在一起;二、明白想要挖掘的是什么(并不是所有数据对特定的知识发现都有用),以及如何从融合的数据中挖掘出有用的知识。
 
以药物发掘。新药上市通常很贵,原因在于研发新药的成本非常高,发现一个新药之前可能失败成千上万次。但如果我们能够用大数据的技术来做预测,把那些不成功的案例删除掉,那么就能够在很大程度上降低新药研发的成本。但是,决定一种药物能否治疗一种疾病,并不仅仅是看药物的化学成分的;事实上,这需要很多种不同类型的信息或数据。例如基因信息、器官组织信息、药物传播临床试验信息等。传统的数据挖掘方法仅仅能够针对一种信息进行深度挖掘,但事实上若想要取得较好的效果,则需要将多种信息综合起来。
电影推荐中,影响用户喜好的因素同样多且复杂。大数据的挖掘是一项挑战不仅需要深度学习,也需要广度学习。
 
640?wx_fmt=jpeg
袁晓如:从遇见到预见 - 数据可视化的未来
 

640?wx_fmt=jpeg

扫描二维码关注公众号,回复: 7597595 查看本文章
北京大学袁晓如

特邀报告接近尾声,最后一位上场的是北京大学研究员、2019CCF 青年“两秀讲者”袁晓如,他的报告题目是“从遇见到预见 - 数据可视化的未来”。
 
数据可视化与可视分析将人类的感知能力、经验智慧与机器的运算能力紧密地结合在一起,是符合人的认知特点的有效数据分析与理解途径。上世纪80年代以来,可视化取得了飞速的发展,涌现了大量新颖的方法和被广泛应用的系统,为各行业使用者提供对数据的洞察力,在科研、决策、政治、公共事物等方面都扮演了不可或缺的角色。
 
袁晓如指出,在计算机产生之前,可视化就已经有各种各样的形式,比如原始人用图来展示世界,再比如宋朝期间就有了的苏州城区图——平江图,图一直都是最方便直观的表现形式。不同以往,现在的可视化,则更多地是指将复杂、海量的大数据转化为更好地读懂的形式,并随着数据日益复杂化,可视化要表达的内容也要丰富得多。
 
那么,可视化到底是在做什么?答案很简单,袁晓如解释:可视化其实就是在数据和人之间,加入一个中间媒介,让我们能够更好去理解我们的世界。实际上就是帮我们对外界的事物建立模型,让我们更好地理解复杂事物。
 
目前,可视化面临的主要挑战是什么?可视化构型的设计空间巨大,包括如何用几何的部件和视觉通道组合起来形成可视化构型,该构型可能表示高维数据,也可能表述网络数据,但这些构型使用的视觉通道不一样,彼此不等价,也许它们针对某一个问题有效,但针对另一个问题可能就不奏效了,因此怎样组合是一个棘手的问题。
 
接着,袁晓如结合一些案例,抛砖引玉,从面向更复杂数据的可视化、可视化的生成更方便、可视化的使用更方便三个维度,来具体阐述可视化在实际数据中的应用情况。
 
最后,他还不忘来个大会特邀报告的总结:“这两天其实有很多的报告,有的人讲人工智能,有的人讲大数据,有的人讲强大的计算能力,如果我们把这个看作推动社会进步的三驾马车的话,不要忘了,还需要一个人驾驶马车。我们需要一个良好的界面来跟我们的马车去进行交互。而我希望可视化将来能够扮演好这个角色,帮助人类更好地去驾驭马车,一同走向美好的明天!谢谢大家。”
 
640?wx_fmt=jpeg

至此,本次大会的所有特邀报告完美结束。你以为这就是全部?图样图森破,我们之后还有……
 
欲知大会后续,且听小芯下回分解(调皮)。

640?wx_fmt=png
推荐阅读专题

640?wx_fmt=jpeg
留言 点赞 发个朋友圈
我们一起分享AI学习与发展的干货

如需转载,请后台留言,遵守转载规范

推荐文章阅读

长按识别二维码可添加关注
读芯君爱你

640?wx_fmt=gif

猜你喜欢

转载自blog.csdn.net/duxinshuxiaobian/article/details/102694136