异构计算场景下构建可信执行环境

本文转载自 OpenHarmony TSC 官方微信公众号峰会回顾第4期 | 异构计算场景下构建可信执行环境

演讲嘉宾 | 金意儿

回顾整理 | 廖   涛

排版校对 | 李萍萍

嘉宾简介

金意儿,华为可信计算首席科学家,IEEE硬件安全与可信专委会联席主席,OpenHarmony技术指导委员会安全及机密计算TSG成员,美国佛罗里达大学名誉教授。2012年毕业于耶鲁大学,获得电气工程博士学位。撰写了《集成电路安全》一书,同时在国际知名期刊和会议上发表了超过200篇论文,是亚洲硬件安全年会的联合创办人,也参与了多个信息安全和集成电路学术会议和学术杂志的组织工作,目前是IEEE设计自动化委员会(CEDA)的杰出讲师。

文章内容来源

第一届开放原子开源基金会OpenHarmony技术峰会——安全及机密计算分论坛

视频回顾

视频链接:

嵌入代码:<iframe src="//player.bilibili.com/player.html?aid=994532812&bvid=BV1Fs4y1S7ZT&cid=1082741929&page=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"> </iframe>

正 文 内 容

异构,即将CPU、DSP、GPU、ASIC、FPGA等不同制程架构、不同指令集、不同功能的算力单元,组合起来形成一个混合的计算系统,使其具有更强大、更高效的功能。如何在异构计算场景下构建可信执行环境呢?华为可信计算首席科学家、IEEE硬件安全与可信专委会联席主席金意儿教授在第一届OpenHarmony技术峰会上提出了几点思考。

金意儿首先从摩尔定律放缓现象作为切入点。摩尔定律自1975年起至2020年得到了快速的发展,使得芯片中集成晶体管的密度大幅提升,推动了半导体商业模式“飞轮”快速运转,但逐渐出现放缓现象;2020年至2030年间,在台积电先进晶片制程工艺发展的引领下,摩尔定律放缓现象更为凸显,似乎摩尔定律红利将“走到尽头”。此外, Dennard Scaling、Amdahl’s Law等定律也在逐步放缓或失效,这预示了计算结构将发生改变。计算结构会如何变化呢?目前主要有3类观点:1.近十年会发生架构的变化,即异构;2.近二十年材料会更新;3.更长远来看,计算的模式会发生变化。总之,短期内异构将成为主流。

备注:图片来自于公开资料

同时,人工智能(AI)推动产业结构优化升级,产业智能化趋势即将颠覆传统产业。而要想更好的运用AI,首先需要对其提供大量异构场景下的算力,在计算数据量变大的背景下,数据中心的性能税现象也逐步凸显,算力的瓶颈由数据运算转为数据搬运。CPU在进行数据计算时大量的时间不是做其擅长的运算,而是搬运数据。基于此,英伟达提出了将数据搬运工作从CPU转移到DPU上进行的方案,在未来数据中心的演进中,CPU用以支持通用计算,GPU支持计算加速,DPU支持数据中心的数据移动和数据处理。

备注:图片来自于公开资料

在计算架构逐步改变的时代浪潮下,安全策略应该如何发展?CPU所不擅长的领域,正在逐渐转移到专业的硬件上进行,导致计算逐渐远离了CPU,而机密计算环境还是在围绕CPU,万一CPU不见了,机密计算环境怎么办?系统安全构建主要有两个方向,一是系统本身的安全,二是系统提供安全能力。系统本身的安全,类似于CET、CFI防护等;系统提供的安全能力,即机密计算环境等。

下图所示为可信计算和异构计算的场景,体现了异构计算与可信计算“并行”“独立”发展。在异构计算场景的迭代中,从以CPU为中心,到CPU只是普通的PU,到未来可能没有CPU。而机密计算却非常“忠诚”,始终围绕CPU,即使最新的ARM CCA技术仍是围绕CPU进行。那么在异构计算场景下,如何构建可信执行环境呢?分布式机密计算是一种思路,将CPU上的技术应用到其他的XPU上是另一种思路,但最关键的问题是怎么用。该问题在AI安全上非常明显,AI模型都在GPU上,TEE想用也用不了,因为其保护边界没有得到扩展。

在学术界,最早Graviton提出了要构建一个大可信执行环境的思路,通过修改GPU,CPU的可信执行环境的理念就可以用在GPU上;HIX提出不一定要改GPU,通过改CPU,加固I/O路径,将TEE扩展到GPU设备上也是可行的;HETEE提出了改进互联的方法,这也是一个跨时代的工作;此外,还有一些学者提出了观察方法,从观察的角度构建一个大的可信执行环境。

总的来说,主要包括3条清晰的路线,即要么改GPU,要么改CPU本身,要么改互联。在未来计算的发展中,CPU不再是中心,以CPU为中心的安全理念应如何往外扩呢?鉴于短期内CPU会继续存在的前提,目前的方案还是以CPU拓展作为主流。互联总线的创新,也会对数据中心的架构产生根本性的变化。而如果互联总线能够支持可信环境的拓展,则可以构建即类似于数据中心原生的可信执行环境。

回到嵌入式系统,我们发现嵌入式系统走得更快。手机上的SOC,很早以前就做到了所有的模块都集中在一个SOC上。将其打开来看,发现SOC的可信环境拓展,走得比数据中心要快、要早,只是因为其在手机内部,大家没有发现。高通的芯片也好,苹果的芯片也好,华为的芯片也好,如果仔细去看,上面都构建着小的TEE环境,其实早就把CPU包进去了,但是这些技术并没有反哺到整个计算系统中。

备注:图片来自于公开资料

金意儿教授最后提到,到底传统的TEE扩展和手机上的TEE扩展会不会是两条线,或者最后会融合,以及传统的TEE的扩展究竟往哪一个方向走,到底是改GPU还是改CPU,还是改互联?期待未来学术界和工业界的共同合作探讨。

点击关注了解更多OpenHarmony TSC技术干货内容

猜你喜欢

转载自blog.csdn.net/OpenHarmony_dev/article/details/132298804