【观察】英特尔:点亮数据中心智能化的“诗与远方”

申耀的科技观察

读懂科技,赢取未来!

毫无疑问,过去几年,随着互联网和数字经济的快速崛起,中国的数据中心建设实现了突飞猛进的增长,但传统数据中心基础设施高能耗属性,也给电力、水资源以及土地资源带来了压力,这意味着传统数据中心相对僵化的建设模式、高能耗、高投入的运营方式也走到了刻不容缓的变革阶段。

从这个角度来看,数据中心作为云服务提供商 (CSP) 业务的核心,未来如何借助新技术进一步降低数据中心运营成本?如何有效减少能源消耗,打造绿色化、智能化的数据中心?俨然成为了当前CSP亟待解决的难题和挑战。

数据中心遭遇新挑战

我们知道,随着云计算快速的发展和迭代,一个全面云化的时代已经来临,很多企业的应用部署范围也从传统的数据中心扩展到到公有云、混合云和私有云的模式,这就迫使“企业上云”的主要服务商CSP的数据中心,不仅需要进一步优化性能、利用率和功耗,同时还要保持高可用性以及合理的成本,具体来说:

一方面,从能耗角度看,当前无论是CSP的传统数据中心,还是规划新的数据中心,都普遍面临着降低能耗及运营成本的严峻挑战。据统计,一个10MW规模的数据中心其10年运营成本中电费占比超过70%,加上高PUE导致了巨大的电力浪费,仅能耗优化一项,就可以带来巨大的经济效益。

另一方面,从运维角度看,随着CSP投资的大型数据中心越来越大以及边缘数据中心的数量急剧增加,机房运维难度不断攀升。然而,由于存在低效性、人员管理的不确定性以及专业人才难获取等多方面的限制,传统依赖于人工的管理、运维在智能化趋势下变得越来越“难以为继”。

扫描二维码关注公众号,回复: 10972188 查看本文章

由此可见,未来的CSP数据中心,必须运用新的技术,使其工作状态、数据能够获得可视并且可管理、可应用,构建多数据中心的集中管理、远程管理、客户端管理等等,这才会让数据中心更加绿色,也更加智能。

遥测技术“应运而生”

正是洞察到了数据中心发展过程中面临的新挑战和新趋势,英特尔过去几年在数据中心领域一直坚持不断创新,通过打造“量身定制”的解决方案,为CSP构建智能化数据中心打下了坚实的基础。

英特尔遥测技术覆盖整个数据中心

一是,在硬件方面,英特尔为CSP提供第二代英特尔至强可扩展处理器,它相比上一代来说在性能上更为出色,能效表现上也更好,同时搭配英特尔傲腾持久内存,也可以实现更高效能、更低能耗。

同时,基于GPU加速的异构计算技术,深度挖掘及调优GPU/FPGA/AI加速芯片的异构加速性能,也能提高数据中心中服务器的效率,由此实现能耗的降低。英特尔第二代至强可扩展处理器也是业内唯一一款集成人工智能加速的x86处理器,其针对高性能计算工作负载中大量数据集的分析进行了优化,这样也就提供了异构环境下的加速性能。

二是,在软件方面,英特尔为CSP提供了功能强大的遥测技术解决方案,该方案通过英特尔至强可扩展处理器内置的传感器,可以提供数据来帮助CSP优化利用率、可靠性和功率。同时,方案中其他监控功能还可以监控诸如内存和缓存使用率这样的性能指标,同时相邻的存储和加速器也可以进一步优化数据中心的运行状况和性能。

与此同时,虽然功率是一个重要的数据中心电源使用效率指标,但温度也是一个关键因素。但往往安装在服务器机架上的温度传感器,事实上很难提供有关每台服务器的实时数据。为此,通过英特尔至强可扩展处理器配备的入口、出口和气流传感器提供的数据,CSP也获取有价值的散热数据。

更重要的是,通过英特尔搭载的出色的可视化工具,CSP也可以设置功率和散热数据的阈值,从而改善数据中心整体电源使用效率管理,并能进一步降低数据中心运维管理难度和复杂度。

三是,在服务方面,英特尔面向CSP提供了Cloud Insider计划,在此过程中,英特尔工程师团队可以与CSP合作伙伴并肩作战,帮助CSP解决产品配置、解决方案搭建等等软硬件层面的问题,通过这种紧密合作,英特尔也能够帮助CSP搭建行业领先的数据中心基础架构。

例如,英特尔的解决方案架构师和工程师精通英特尔节点管理器技术、智能平台管理接口 (IPMI)、收集器、时间序列数据库、可视化功能、编排器、容器等,这些专业知识和技能也可以为CSP实时提供有关基础设施功能、利用率和事件的全面视图,实现工作负载的完全自动化和编排。

不难发现,借助英特尔至强可扩展处理器以及功能强大的遥测解决方案,驱动电源管理、散热管理和工作负载优化,不仅可以增加数据中心正常运行时间、降低总体拥有成本和电源使用效率,也能够加速推动数据中心朝着智能化的发现发展。

三步走实现创新之旅

客观的说,CSP要实现数据中心智能化并不是“一蹴而就”的过程,这是因为在数据中心的管理中,发现并弥补工具缺口然后再开始收集遥测数据已经是一项非常艰巨的任务,同时还要妥善使用数据,并使遥测解决方案能从几个节点扩展到数千个节点,更是难上加难,此外功率和散热的关联性也让问题变得更加复杂。

基于此,英特尔给出的建议是,通过“三步走”的方式就能完成数据中心智能化的创新之旅,具体来说:

首先,CSP要实现数据中心基础设施的现代化和智能化,首当其冲的就是要学习如何将数据中心内已经存在的遥测功能公开给一个或多个数据中心管理工具。然后,与遥测数据进行互动以采取措施,从而逐步提高遥测技术的成熟度。

其次,使用数据分析实现自动监控和操作,英特尔遥测技术带来的好处就是,可以收集到大量的数据,因此CSP基于数据分析显然能为及早发现问题并尽早采取措施提供支持。比如,CSP的管理和运维工程师可以在服务器性能开始下降时立即转移工作负载,或在察觉到气候变化时自动调整数据中心的冷却设备。依靠遥测数据,CSP真正可以完成预防性维护,从而缩短故障时间、降低紧急情况出现的频率并提高数据中心的效率。

最后,英特尔建议CSP引入机器学习和人工智能来打造真正自治、自我监控和自我修复的数据中心,同时优化电源使用效率和总体拥有成本。在这方面,英特尔至强可扩展处理器作为实现人工智能的基石,也一直在不断提升人工智能训练和推理性能。据今年年初英特尔在CES 2020上宣布的,英特尔即将于今年推出的第三代英特尔至强可扩展处理器(代号Cooper Lake),将包含面向集成人工智能训练加速的全新英特尔DL Boost扩展指令集,与之前的产品系列相比,其训练性能大幅提升。

值得一提的是,英特尔还提供了一个参考架构,让CSP也可以轻松地将人工智能功能添加到自己的云堆栈中,让AI的性能得以增强,由此更好的帮助CSP打造差异化的竞争力,并将人工智能的价值发挥到最大化。

例如,新华三通过引入第二代英特尔至强可扩展处理器,不仅为其先知网络架构(SNA)输出强大的算力支持,更结合新架构在不同应用场景中的需求,为其AI训练和推理过程提供多种优化的AI方案,而来自验证性测试的结果也表明:因为英特尔至强平台集成AI加速能力,基于该平台的SNA具有很强的AI训练能力,并在最终用户的实际部署中赢得了良好的反响。

全文总结,目前数据中心的发展正进入关键阶段,特别是未来CSP的数据中心基础设施建设,一定需要适应智能化、高密度,低PUE值的严格要求,由此才能真正让数据中心实现创新发展。在此过程中,英特尔通过技术和解决方案的不断创新,以及对CSP提供的“量身定制”的服务,将为数据中心智能化、智慧化的发展持续贡献更高的价值,并点亮数据中心未来的“诗与远方”。

申耀的科技观察,由科技与汽车跨界媒体人申斯基(微信号:shenyao)创办,16年媒体工作经验,拥有中美两地16万公里自驾经验,专注产业互联网、企业数字化、渠道生态以及汽车科技内容的观察和思考。

发布了487 篇原创文章 · 获赞 65 · 访问量 25万+

猜你喜欢

转载自blog.csdn.net/W5AeN4Hhx17EDo1/article/details/105501219