解决一云多芯全球命题,浪潮云海给出了解题思路

云计算,生而为用户简化资源的使用,让用户不必关注复杂的底层硬件架构,而是通过“服务”的方式调用资源,专注于自己的业务创新。

因此,用户要上云,就天然地要求云平台必须能够屏蔽底层的硬件架构,并依据上层应用的特点完成资源的自适应调度和统一管理。云计算厂商必须竭尽所能,做好这个本份。

一云多芯全球命题

芯片,IT基础设施之基,为IT能力的释放提供运算的支撑。

随着大数据、人工智能、边缘计算、物联网等技术平台和业务应用的发展,不同的芯片架构擅长不同的业务场景,带来了x86、ARM、RISC-V等多种芯片架构并存,SoC、CPU、AIPU等类型芯片涌现,加之有些客户出于业务连续性的考虑,选择不把鸡蛋放在一个篮子里,引入了更多的芯片组合,所有这些,让IT环境变得越来越复杂。

而以亚马逊、谷歌、Meta等为代表的高科技企业,早在多年前便自研芯片。近年来,更是不得不进行一云多芯的试验和应用。

巨头企业尚且如此。如何让用户对纷繁庞杂的芯片“零”感知,成为所有云计算提供商的挑战。一云多芯,全球命题。

首个“一云多芯”SPEC Cloud基准测试,浪潮云海硬刚全球命题

相比于国外,国内因为需求驱动,导致芯片环境更为复杂。

“芯”之“多”,有这样一组统计数字:截至2021年5月,仅国内AI芯片行业的企业数量就已超过3000家。又过了两年有余,且随着“百模”、“千模”大战进入白日化,这个数字只会越来越恐怖。

越是复杂的环境,越能磨练一个人的意志,激发潜力。对于企业,也是如此。我们看到,以阿里云为代表的公有云厂商,多年前便布局一云多芯,并取得了一定的成果。而最近,面向更加复杂的私有云场景,浪潮云海“一云多芯”异军突起,完成业界首个“一云多芯”SPEC Cloud基准测试,建立了行业参考基准,并推动“一云多芯”在多个行业落地。

对此,浪潮数据董事长张东表示:“对于浪潮云海而言,‘一云多芯’已经不再是一个简单的口号,而是努力践行的方向。”

近日,浪潮云海OS已经完成了全球唯一面向一云多芯场景的SPEC Cloud基准测试,在三种处理器节点混合部署集群测试中,相对可扩展性、平均实例配置时间等指标均达到全球领先水平,验证了云海OS在业务应用跨处理器架构场景下的高效率、高性能和高扩展能力。这是云海OS在继成功完成全球最大规模单一集群达1000节点的云数智融合实践,并建立“大规模云集群参考设计规范”后,又一次引领私有云发展趋势,建立了以“一云多芯”为核心的云平台参考基准。

资料显示,SPEC是由全球几十所知名大学、研究机构、IT企业组成的第三方测试组织,拥有SPEC CPU、SPEC Power、SPEC Cloud、SPEC ML等多项公开的标准化测试规范和模型。其中,SPEC Cloud IaaS 2018(简称SPEC Cloud)作为权威的云计算性能基准测试,在综合性能、可扩展性和实例部署时间等方面综合评估云平台性能,是目前全球最受企业级客户认可的IaaS云性能评估基准。

SPEC Cloud通过YCSB和K-Means两类实例,分别模拟公有云、私有云、混合云等多种云场景下的IO密集型和计算密集型工作负载,从而验证云平台的综合性能、可扩展性。其中,YCSB任务构建Cassandra实例模拟标准社交媒体NoSQL数据库应用场景,测试项包括吞吐量、数据库插入、读取响应时间、应用实例配置时间;K-Means任务通过大数据基准测试工具HiBench构建多个实例进行K-Means算法测试,测试项包括完成时间、实例运行的Hadoop迭代计数、应用实例配置时间。整个测试过程通过不断增加负载压力,来评估云平台的数据面性能、可扩展性以及控制面性能。

在此次SPEC Cloud测试中,浪潮云海在x86+ARM混合处理器架构集群上部署了云海OS,取得多项指标媲美甚至超出单一芯片架构集群的性能表现。其中,在平均实例部署时间上,云海OS实现了SPEC Cloud IaaS 2018云基准测试的最佳数值,展现出在控制面的高效稳定调度与并发能力、资源实例的快速拉起与响应能力;在性能得分上,云海OS在一云多芯场景下的性能得分超过SLA基线20%,表明在一云多芯的场景下依然拥有出色的性能表现;在相对可扩展性方面,云海OS也达到接近线性的90%以上,说明在一云多芯场景下业务负载可以有效弹性扩展。

此次SPEC Cloud结果表明,云海OS在一云多芯场景下具备高效率、高性能和高扩展性,可实现跨架构资源池混合部署、架构感知适应性调度、应用负载实例快速配置与创建、高并发与负载均衡等,能够有效帮助企业级用户完成一云多芯资源统一管理、负载均衡调度、应用高效稳定运行和业务弹性扩展。

先进理念+硬核技术+繁荣生态浪潮云海的“一云多芯”解题思路

在张东看来,浪潮云海之所以取得这样的成绩,在于先进理念+硬核技术+生态的支撑。

先进理念

浪潮云海认为,一云多芯的最终目标是支撑用户业务在不同架构处理器之间的低成本切换或者自由切换。在实现上,可以分为“有-好-优”三步走来实现一云多芯的中长期目标。

  1. 第一阶段:“有”阶段——混合部署、统一管理、统一视图。本阶段以云为入口,通过云操作系统实现异构处理器服务器的统一管理,覆盖国内外主流处理器,提供统一操作界面、操作方式及统一监控运维等,解决云资源池只能承载单一厂商或单一架构处理器的服务器而导致的应用无法跨架构部署、协同的问题。
  2. 第二阶段:“好”阶段——业务牵引、分层解耦、架构升级。在“有”阶段的基础上,进一步实现应用的低成本跨架构切换。通过资源层、平台层和应用层的分层解耦设计,实现架构升级。在资源层面,通过跨平台的迁移实现应用跨架构快速部署。在平台层面,实现平台应用的跨架构混合部署,如数据库集群在一云多芯平台上实现跨架构的状态同步、数据同步,实现了多实例在不同处理器架构的服务器上的并行运行。在应用层面,可通过服务网格等技术实现应用的跨架构流量切分。
  3. 第三阶段:“优”阶段——算力标准、全栈多芯、生态共建。从业务连续性的维度,一云多芯的终极目标是实现应用与芯片架构的彻底解耦。这需要硬件、云以及应用等产业链上下游的共同协同,完善异构架构下有效算力的量化方法,以支持应用在不同架构处理器间的等价切换。共同推动应用与云基础设施的一云多芯相结合,打造垂直一体化方案,实现应用层面的跨架构无感知切换。在标准和测评方面,联合专业软件测评机构及产业链上下游生态,形成一云多芯行业标准。

在具体实现上,这三个阶段也会交叉进行,比如浪潮云海自认处于“有”阶段,但也会做“好”阶段的资源封装的迁移,甚至“优”阶段的标准和测评的工作。

核心技术

据浪潮数据云计算技术总监亓开元、方案总监刘健介绍,浪潮云海“一云多芯” 通过持续创新,实现了全面的技术引领。

  1. 开放兼容:兼容全系列处理器,支持X86、ARM、MIPS、Alpha等架构的虚拟化、容器云管理,率先落地“一云多芯”的统一池化管理及调度。浪潮云海在业界最早实现单集群多种芯片资源混部,减少管理节点开销;率先完成自适应调度功能,可根据业务特征自动调度适合的CPU类型算力;支持面向多架构芯片的业务流量切分,可自定义不同架构的副本和流量切分比例,同时实现多芯应用跨架构切换和迁移。
  2. 性能优异:在性能表现上,浪潮云海OS采用X86+ARM的混合处理器架构完成全球首个面向一云多芯场景的SPEC Cloud基准测试,一云多芯场景下的性能得分超过SLA基线20%。
  3. 云智融合:升级为智算OS,全面融合通用算力、AI算力、HPC算力,实现多元算力的融合调度,提供丰富的全栈服务目录。

“繁荣”生态

一个繁荣的生态,是任何技术、业务发展所不可或缺的。“一云多芯”自然也不例外。“一云多芯”的生态,说到底是一个以云为核心、从上到底的一套产业链的生态。

当前,“一云多芯”生态尚处于萌芽,还只是在芯片、整机等层面的,谈不上“繁荣”。只有更多的数据库、中间件等厂商进到生态,从应用厂商到平台厂商再到整个IT产业链,都支持“一云多芯”,才是生态真正“繁荣”的标志。到那时我们才有底气说,构建了有中国特色的领先全球的“一云多芯”新生态。

浪潮云海,正在通过“先进理念+硬核技术+繁荣生态”三驾马车,着眼于解决“一云多芯”的全球命题,给出了自己的解题思路。

猜你喜欢

转载自blog.csdn.net/FL63Zv9Zou86950w/article/details/131793049