数字孪生DARPA X-DATA项目


2012年,作为对当时奥巴马政府《大数据研发计划》(Big Data Research and Development Initiative)的响应,DARPA宣布了X-DATA项目,希望可以开发处理国防任务中大量信息的数据工具,每年资助2500万美元,时间周期为四年。时任DARPA执行主任凯格哈姆·加布里埃尔(Kaigham Gabriel)为了鼓励大家参与该项目,用大西洋3.5亿立方公里海水(约1万亿亿加仑)来类比,称每加仑海水代表一字节,那么它只够装入全世界2010年全年产生的数据,因此,开发新数据工具非常重要。

要想实现数字孪生化目标,就会产生多到难以想象的数据,这一点是显而易见的。凯格哈姆·加布里埃尔当时没有用数字孪生体来描述可能产生的大量数据,只是不想让大家感到困惑,毕竟那个时候DARPA还把数字孪生体作为机密的未来项目在开展,通过与美国空军研究实验室合作,推动机身数字孪生体项目是其优先级较高的事项。

DARPA X-DATA项目

经理克里斯·怀特(Chris White)表示,通过邀请技术社区专业人士参与构建面向未来的数据生态,特别是邀请商业企业的专家参与,可以提高美国国防技术的创新能力,例如,DARPA特别欢迎互联网领域的专家提供他们的智慧,诸如微软、谷歌、脸书、亚马逊等互联网公司就参与了DARPA不少云计算、人工智能和数据科学的项目。

如果大家还记得机身数字孪生体项目在2013年年初开始招标,那么对当时DARPA和美国国防部的工作重点应有所了解,它们通过开放式创新和开源社区的方式,推动数据科学、人工智能和数字孪生体等新领域的创新发展。DARPA作为美国国防部负责推进颠覆性技术研发的机构,专注新技术概念的验证,而美国国防部的其他军种研究机构结合自身需要,推出具体的研制项目,邀请企业参与竞标。

2017年,DARPA的主任特别助理威廉·雷格利(William Regli)和信息创新办公室主任布莱恩·皮尔斯(Brian Pierce)联合做了一个主题为《DARPA和数据:研究组合简介》的演讲,分享了DARPA在过去十年期间,不断创新方法,发掘数据价值。其中,数字孪生体正是DARPA探索数据应用方法的一个有突破的方向。

威廉·雷格利和布莱恩·皮尔斯回顾了DARPA主要部门在过去十年间围绕数据应用所做的探索。

(1)信息创新办公室:

软件系统、人工智能和数据分析;

(2)国防科学办公室:

领域驱动的问题(化学、社会科学、材料科学和工程设计等);

(3)微系统技术办公室:

新硬件支持这些处理(包括神经芯片、图形处理器、学习系统等)。

DARPA通过各种项目来推动实现相关战略。例如,DARPA Open Catalog是一个开源项目,要求参与方提供处理数据的工具,并鼓励大家把工具开源,其目的是为了构建一个面向未来数据处理需要的工具池。这里面的工具包括大数据、国防网络、工程设计、机器阅读等测试床项目。

在数据生态领域,DARPA分信息(或数据)、知识和理解三个阶段进行投资,同时,这三个阶段又分为算法和分析、服务和中间件两个领域,具体见表3-3。过去十年,DARPA资助了上百个项目。虽然DARPA只有220名正式员工,其中100名都是项目经理,他们负责为资助项目提供帮助,这种高效率的颠覆性创新模式很值得中国借鉴、学习。在这里插入图片描述
与大部分大数据专家的观点不同,DARPA强调数据不是一定要进行组织和整理(清洗)的,道理很简单,如果要做这些预处理,将带来两个方面的弊端:一是处理周期较长,影响数据的实时应用,或者根本无法满足实时应用的需要;二是数据预处理之后,有可能遗失重要或关键信息,之所以大家采用预处理方式,是因为现有的数据工具不够先进,只能处理结构性数据,如果开发了新的数据工具,那么对原始数据的直接处理就变得可行了。

为了解决以上提及的数据工具问题,DARPA信息创新办公室启动了X-DATA项目,该项目被称为“通用数据网络基础设施”(Common Data Cyber-Infrastructure),它分为数据源、平台/抽象层、数据分析、可视化、交互和查询等多个过程,为了在每个过程之间进行衔接,它们之间都有特定的应用编程接口(API,Application Programming Interface),便于实现软件开发。

数据源来自雷达、语音、视频、文本、文档、元数据、网络等多种多样的供应方,这些数据通常都要进行转化。例如,雷达数据需要转化为可以跟踪的信息,语音会转为文本,视频会抽取出内容,文本则解析出主题及相关内容,在这个基础上,利用数据注入API(Data Ingest API)导入平台进行处理。

正如DARPA自称X-DATA为网络基础设施,它建设了一个可以对大量异构数据进行处理的新型基础设施,如果把它应用到数字孪生体领域,那么就成了数字孪生基础设施(DTI,Digital Twin Infrastructure),这对于实现数字孪生化的相关功能必不可少,特别是在线数据融合或动态孪生。

X-DATA服务于DARPA多个数据相关的项目,实现了人机协同(HumanMachine Symbiosis)。例如,它在颠覆合成化学材料中扮演了重要角色,DARPA国防科学办公室的MAKE-IT新材料项目就用到了该基础设施;在颠覆性设计项目TRADES中,科学家利用X-DATA成功实现了新数学和算法的探索,实现了新的创新设计,从而为找到新材料和流程提供了启发。

通过X-DATA项目,DARPA资助了不少团队开发数据工具,并把这些工具开源出来。2014年2月,DARPA官方网站发布了开放列表(Open Catalog),把这些数据工具开放给公众,目前这些工具可以为大家所查询和下载。负责该项目的DARPA信息创新办公室表示,如果研究人员对DARPA公布的数据工具感兴趣,将开放更多的开源数据工具。

随着DARPA启动开放列表服务

,除了X-DATA相关项目,其他部门也把相关项目放到这个数据库中。现在DARPA开放列表称,该数据库包括DARPA资助的软件、同行评议的印刷品和数据。通过资助不同领域的基础和应用研究,获得实验性结果和可重用的技术,推动政府各部门的数字化转型,这正是DARPA开放战略(Open Strategy)的目标。

从DARPA X-DATA和开放列表服务的工作中我们能理解数字孪生化的工作涉及的创新比较广泛,如果仅仅满足于可视化给领导汇报的需求,自然不需要做这么多工作,但如果我们需要通过数字孪生化产生实际的生产力提升或业绩增长,则需要在诸多领域做大量基础和应用研发等工作。

猜你喜欢

转载自blog.csdn.net/leva345/article/details/132983879