本文转载自 OpenHarmony TSC 官方微信公众号《峰会回顾第4期 | 异构计算场景下构建可信执行环境》

演讲嘉宾 | 金意儿

回顾整理 | 廖涛

排版校对 | 李萍萍

嘉宾简介

金意儿，华为可信计算首席科学家，IEEE硬件安全与可信专委会联席主席，OpenHarmony技术指导委员会安全及机密计算TSG成员，美国佛罗里达大学名誉教授。2012年毕业于耶鲁大学，获得电气工程博士学位。撰写了《集成电路安全》一书，同时在国际知名期刊和会议上发表了超过200篇论文，是亚洲硬件安全年会的联合创办人，也参与了多个信息安全和集成电路学术会议和学术杂志的组织工作，目前是IEEE设计自动化委员会(CEDA)的杰出讲师。

文章内容来源

第一届开放原子开源基金会OpenHarmony技术峰会——安全及机密计算分论坛

视频回顾

视频链接：

嵌入代码：<iframe src="//player.bilibili.com/player.html?aid=994532812&bvid=BV1Fs4y1S7ZT&cid=1082741929&page=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"> </iframe>

正文内容

异构，即将CPU、DSP、GPU、ASIC、FPGA等不同制程架构、不同指令集、不同功能的算力单元，组合起来形成一个混合的计算系统，使其具有更强大、更高效的功能。如何在异构计算场景下构建可信执行环境呢？华为可信计算首席科学家、IEEE硬件安全与可信专委会联席主席金意儿教授在第一届OpenHarmony技术峰会上提出了几点思考。

金意儿首先从摩尔定律放缓现象作为切入点。摩尔定律自1975年起至2020年得到了快速的发展，使得芯片中集成晶体管的密度大幅提升，推动了半导体商业模式“飞轮”快速运转，但逐渐出现放缓现象；2020年至2030年间，在台积电先进晶片制程工艺发展的引领下，摩尔定律放缓现象更为凸显，似乎摩尔定律红利将“走到尽头”。此外， Dennard Scaling、Amdahl’s Law等定律也在逐步放缓或失效，这预示了计算结构将发生改变。计算结构会如何变化呢？目前主要有3类观点：1.近十年会发生架构的变化，即异构；2.近二十年材料会更新；3.更长远来看，计算的模式会发生变化。总之，短期内异构将成为主流。

备注：图片来自于公开资料

同时，人工智能（AI）推动产业结构优化升级，产业智能化趋势即将颠覆传统产业。而要想更好的运用AI，首先需要对其提供大量异构场景下的算力，在计算数据量变大的背景下，数据中心的性能税现象也逐步凸显，算力的瓶颈由数据运算转为数据搬运。CPU在进行数据计算时大量的时间不是做其擅长的运算，而是搬运数据。基于此，英伟达提出了将数据搬运工作从CPU转移到DPU上进行的方案，在未来数据中心的演进中，CPU用以支持通用计算，GPU支持计算加速，DPU支持数据中心的数据移动和数据处理。

备注：图片来自于公开资料

在计算架构逐步改变的时代浪潮下，安全策略应该如何发展？CPU所不擅长的领域，正在逐渐转移到专业的硬件上进行，导致计算逐渐远离了CPU，而机密计算环境还是在围绕CPU，万一CPU不见了，机密计算环境怎么办？系统安全构建主要有两个方向，一是系统本身的安全，二是系统提供安全能力。系统本身的安全，类似于CET、CFI防护等；系统提供的安全能力，即机密计算环境等。

下图所示为可信计算和异构计算的场景，体现了异构计算与可信计算“并行”“独立”发展。在异构计算场景的迭代中，从以CPU为中心，到CPU只是普通的PU，到未来可能没有CPU。而机密计算却非常“忠诚”，始终围绕CPU，即使最新的ARM CCA技术仍是围绕CPU进行。那么在异构计算场景下，如何构建可信执行环境呢？分布式机密计算是一种思路，将CPU上的技术应用到其他的XPU上是另一种思路，但最关键的问题是怎么用。该问题在AI安全上非常明显，AI模型都在GPU上，TEE想用也用不了，因为其保护边界没有得到扩展。

在学术界，最早Graviton提出了要构建一个大可信执行环境的思路，通过修改GPU，CPU的可信执行环境的理念就可以用在GPU上；HIX提出不一定要改GPU，通过改CPU，加固I/O路径，将TEE扩展到GPU设备上也是可行的；HETEE提出了改进互联的方法，这也是一个跨时代的工作；此外，还有一些学者提出了观察方法，从观察的角度构建一个大的可信执行环境。

总的来说，主要包括3条清晰的路线，即要么改GPU，要么改CPU本身，要么改互联。在未来计算的发展中，CPU不再是中心，以CPU为中心的安全理念应如何往外扩呢？鉴于短期内CPU会继续存在的前提，目前的方案还是以CPU拓展作为主流。互联总线的创新，也会对数据中心的架构产生根本性的变化。而如果互联总线能够支持可信环境的拓展，则可以构建即类似于数据中心原生的可信执行环境。

回到嵌入式系统，我们发现嵌入式系统走得更快。手机上的SOC，很早以前就做到了所有的模块都集中在一个SOC上。将其打开来看，发现SOC的可信环境拓展，走得比数据中心要快、要早，只是因为其在手机内部，大家没有发现。高通的芯片也好，苹果的芯片也好，华为的芯片也好，如果仔细去看，上面都构建着小的TEE环境，其实早就把CPU包进去了，但是这些技术并没有反哺到整个计算系统中。

备注：图片来自于公开资料

金意儿教授最后提到，到底传统的TEE扩展和手机上的TEE扩展会不会是两条线，或者最后会融合，以及传统的TEE的扩展究竟往哪一个方向走，到底是改GPU还是改CPU，还是改互联？期待未来学术界和工业界的共同合作探讨。

点击关注了解更多OpenHarmony TSC技术干货内容

异构计算场景下构建可信执行环境

本文转载自 OpenHarmony TSC 官方微信公众号《峰会回顾第4期 | 异构计算场景下构建可信执行环境》

点击关注了解更多OpenHarmony TSC技术干货内容

猜你喜欢