Supermicro 1024US-TRT 服务器评测:1U 机箱中的 128 个内核

对提高计算密度的推动仍在继续,像 Supermicro 的 1024US-TRT 这样 “A+ Ultra”系列服务器,旨在通过强大的计算能力和丰富的连接选项来响应这一需求。Supermicro 为企业应用、高端云计算、虚拟化和技术计算工作负载中的高密度环境设计了这款纤薄的 1U 双路服务器。该平台支持分布在 32 个 DIMM 上的高达 8TB DDR4 内存,以及大量的 PCIe 4.0 连接、双 10 GbE LAN 端口以及前托架中最多四个 NVMe 设备。
在这里插入图片描述
该平台支持双AMD EPYC 7003和 7002 处理器,这意味着它支持 EPYC Milan、Milan-X或EPYC(霄龙)罗马处理器。Supermicro 的 Intel Ice Lake X12 服务器无法在单个平台中匹配如此多的内核和线程,这表明 1024US-TRT 在其产品组合中提供了最高密度。

AMD 的EPYC Genoa将于今年晚些时候推出,以与英特尔不断延迟的Sapphire Rapids竞争,为 AMD 的持续主导地位或英特尔的复兴奠定基础。在我们等待这些发布的同时,我们来看看我们的一些基准测试以及数据中心 CPU 性能层次结构在几个竞争激烈的价格范围内的当前状态。

Supermicro 1024US-TRT 服务器

Supermicro 1024US-TRT 服务器采用 1U 外形尺寸,可实现令人难以置信的密度。该服务器支持 AMD 的 EPYC(霄龙)7002 和 7003 处理器,每个处理器最高可达 64 个内核,转换为跨双插槽分布的 128 个内核和 256 个线程。此外,该平台还支持 AMD 的Milan-X芯片(BIOS 版本 2.3 或更高版本),该芯片配备多达 64 个内核和 128 个线程,搭配曾经不可想象的 768MB 三级缓存。这些芯片帮助 1024US-TRT 适应其传统目标市场之外的更多样化的工作负载,也扩展到技术计算工作负载。这包括电子设计自动化 (EDA)、计算流体动力学 (CFD)、有限元分析 (FEM) 和结构分析等工作负载。
在这里插入图片描述
1024US-TRT 具有带方形钉的免工具导轨安装系统,可轻松安装到服务器机架中,CSE-819UTS-R1K02P-A 机箱尺寸为 1.7 x 17.2 x 29 英寸,可滑入 19 英寸机架。

该服务器可容纳高达 280W 的 CPU TDP,但使用超过 225W 的芯片需要特殊调整。因此,该服务器在技术上可以支持最强大的 EPYC 处理器,例如 7Hxx 系列型号,但您需要使用 Supermicro 验证这些配置。

前面板配有标准指示灯,例如指示各种类型的故障和过热的彩色信息灯,同时还用作单元识别 LED。它还包括硬盘驱动器活动、系统电源和两个 LAN 活动 LED。电源、重置和单元识别 (UID) 按钮也出现在前面板的右上方,后者照亮服务器后部的灯,以便将单元定位在包装好的机架中。

默认情况下,系统有四个免工具 3.5 英寸热插拔 SATA 3 驱动器托架,但您可以将服务器配置为在前面板上接受四个 NVMe 驱动器(SSD 使用 2.5" 适配器)。我们测试了PCIe 4.0 Kioxia 1.92TB KCD6XLUL1T92 SSD。您还可以添加可选的 SAS 卡以支持 SAS 存储设备和光驱。
在这里插入图片描述
从机箱上弹出顶部可以看到两个装有风扇的外壳。共有八个风扇为系统提供空气,每个外壳包括四个 Sunon 23,300 RPM 反向旋转 40 x 40 x 56 mm 风扇,以实现最大静压并减少振动。正如预期用于 24/7 运行的服务器一样,系统可以在风扇发生故障时继续运行。但是,如果系统检测到故障,其余风扇将自动全速运行。您可以通过 BMC(而不是 BIOS)管理风扇速度和配置文件。
在这里插入图片描述
四个风扇冷却每个 CPU,一个简单的黑色塑料罩将空气引导到下面的散热器。双 SP3 插槽容纳两个处理器,这些处理器由针对线性气流优化的标准 CPU 散热器覆盖。

每个处理器侧面共有 16 个内存插槽,总共 32 个插槽可支持高达 8TB 的 ECC DDR4-3200 内存(通过 256GB DIMM),轻松超过竞争对手英特尔平台的可用内存容量。我们使用 16 个 16GB DDR4-3200 SK hynix 模块测试了 EPYC Milan 处理器,总内存容量为 256GB。相比之下,Icel Lake Xeon 对比平台配备 16x 32GB SK hynix ECC DDR4-3200,总容量为 512GB 内存。
在这里插入图片描述
H12DSU-iN 主板的扩展插槽由两个全高 9.5 英寸 PCIe 4.0 x16 插槽和一个低矮型 PCIe 4.0 x16 插槽组成,全部安装在转接卡上。还提供了一个额外的内部 PCIe 4.0 x16 插槽,但该插槽仅接受专有的 Supermicro 卡。
在这里插入图片描述
后 I/O 面板包括两个由 Intel X710-AT2 NIC 供电的 10 Gb RJ45 LAN 端口,以及一个用于管理的专用 RJ45 IPMI LAN 端口。在这里,我们找到了机器上唯一的 USB 端口,它们以两个 USB 3.0 接头的形式出现(可惜前面没有 USB 端口),以及一个 COM 和 VGA 端口。
在这里插入图片描述
两个带 PMBus 的 1000W 80% Plus Titanium 级冗余电源为服务器供电,在发生故障时具有自动故障转移功能,并且具有热插拔功能,便于维修。
在这里插入图片描述
BIOS 易于访问和使用,并提供大量可调参数,包括 CPU 功率阈值调整,而 IPMI Web 界面提供丰富的监控功能和轻松的远程管理,与其他类型平台可用的功能类型相匹配。在众多选项中,您可以更新 BIOS、使用 KVM-over-LAN 远程控制台、监控功耗、访问健康事件日志、监控和调整风扇速度,以及监控 CPU、DIMM 和芯片组的温度和电压。Supermicro 的远程管理套件精致且易于使用。
在这里插入图片描述

测试设置

我们正在测试的 240W 64 核 EPYC 7713 并不是 AMD EPYC Milan 系列中频率最高的 64 核。这种区别在于 64 核 EPYC(霄龙)7763 具有 2.45 基本频率和 3.5 GHz 升压时钟频率,以及更高的 280W TDP。当您将此 EPYC 芯片与 Ice Lake 旗舰产品 Xeon Platinum 8380 进行比较时,请记住这一点,后者还具有更高的 270W TDP。
在这里插入图片描述
我们使用 Supermicro 1024US-TRT 服务器来测试 EPYC 7713 Milan 处理器,而我们使用 Supermicro 1024US-TR4 服务器来测试四种不同的 EPYC Rome 配置。

我们使用带有 Coyote Pass 服务器主板的英特尔 2U 服务器系统 S2W3SIL4Q 软件开发平台来测试 Ice Lake Xeon Platinum 8380 处理器。该系统针对气流进行了高度优化,八个 2.5" 存储托架两侧有大的空托架,可允许大量进气。

我们使用Phoronix 测试套件进行测试。这个自动化测试套件简化了在 Linux 环境中运行复杂的基准测试。测试套件由 Phoronix 维护,它安装了所有需要的依赖项,测试库包括 450 个基准测试和 100 个测试套件(并且还在增加)。Phoronix 还维护http://openbenchmarking.org,这是一个用于将测试结果上传到中央数据库的在线存储库。我们使用 Ubuntu 20.04 LTS 和默认的 Phoronix 测试配置和 GCC 编译器进行以下所有测试。我们还使用所有可用的安全缓解措施对这两个平台进行了测试。

Linux 内核和 LLVM 编译基准

1024US-TRT 中的双 EPYC(霄龙)7713 处理器完成了 Timed Linux Kernel Compilation 基准测试,该基准在默认设置下构建 Linux 内核仅需 19 秒,超过 Xeon Platinum 8380。这令人难以置信——请记住,7713 的 TDP 为 225W,这意味着它是低频 64 核 EPYC(霄龙)变体。相比之下,Ice Lake 芯片的 TDP 额定值为 270W。AMD 的米兰旗舰产品 7763 将在此基准测试中处于领先地位。
在这里插入图片描述AMD 的 EPYC(霄龙)7713 在 Timed LLVM Compilation 工作负载中也战胜了 8380,在 178 秒内完成了测试。此外,考虑到后者是低频版本,从 EPYC 7742 到 7713 的性能扩展比我们预期的更明显,7713s 完成基准测试的速度比上一代旗舰产品快 10%。

分子动力学和并行计算基准

NAMD 是一种并行分子动力学代码,旨在与额外的计算资源一起很好地扩展;它可扩展到 500,000 个内核,是用于通过模拟代码量化性能的主要基准之一。EPYC(霄龙)处理器非常适合这些类型的高度并行工作负载,因为它们具有惊人的核心数量,但英特尔的 Ice Lake 也是一股不可忽视的力量。这种工作负载通过扩展工作负载使内核完全饱和,从而产生沉重的热负载,但 Supermicro 1024US-TRT 没有显示出任何影响性能的热量迹象。EPYC 7713 再一次对英特尔的 TDP 更高的旗舰产品留下了深刻印象。
在这里插入图片描述
Stockfish 是一种国际象棋引擎,旨在通过增加核心数量实现最大的可扩展性——它可以扩展到 512 个线程。在这里,我们可以看到这种大规模并行代码的可扩展性非常好,EPYC 7713 在基准测试图表中名列前茅。

渲染基准

64 核 EPYC Milan 和 EPYC Rome 处理器令人信服地引领了这一系列基准测试,尽管 Intel 的 Ice Lake 确实缩小了一些 Blender 渲染的竞争范围并在其他渲染中领先。

编码器往往会带来不同的挑战:正如我们在 VP9 libvpx 基准测试中看到的那样,它们通常无法随着核心数量的增加而很好地扩展。相反,它们通常受益于每核性能和其他因素,如缓存容量。在这里,我们可以看到英特尔的 8380 以微薄的优势领先,但 AMD 的 EPYC Milan 7713 令人难以置信的令人印象深刻,因为它的功耗和热预算要低得多。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

压缩和安全

压缩工作负载也有多种形式。例如,7-Zip (p7zip) 基准测试暴露了理论压缩性能的高度,因为它直接从主内存运行,允许内存吞吐量和核心数量对性能产生重大影响。在这里,我们可以看到 EPYC 7713 大大受益,因为它们领先于 8380。相比之下,压缩 Linux 4.13 内核源代码树的两个副本的 gzip 基准测试往往对快速时钟速率响应良好,从而使 16 核 EPYC 7F52 处于领先地位。不过,7713 仍然令人印象深刻,因为它们排在第二位。
在这里插入图片描述
开源 OpenSSL 工具包使用 SSL 和 TLS 协议来测量 RSA 4096 位性能。正如我们所见,由于 EPYC 处理器的并行化特性,该测试有利于它,但将这种类型的工作负载卸载到专用加速器对于要求高的环境变得越来越普遍。

结论

随着 EPYC 产品线的成熟,AMD 具有前瞻性的 SP3 插槽设计为服务器制造商提供了足够的灵活性,而 Supermicro 1024US-TRT 服务器充分展示了这种能力。通过支持 EPYC 7002 和 7003 处理器、高频 H 系列和 F 系列,甚至 Milan-X CPU,该平台不断发展以支持不断增长的 EPYC 阵容。

Supermicro 经过全面验证的系统配备完全配置的硬件,使用免工具导轨套件进行机架安装既简单又快捷。在我们的测试中,我们发现该系统非常强大,为处理器提供充足的电力,由高质量的 Titanium 电源供电,并由八个风扇提供充足的冷却。在产生大量热负载的大量持续时间较长的全核工作负载期间,我们没有注意到热量产生的任何不利影响,这表明冷却系统设计得很好。

在硬件方面,双 10GbE LAN 和 PCIe 4.0 接口提供了丰富的连接选项,而对高达 8TB ECC 内存的支持使服务器能够利用 EPYC Milan 的巨大吞吐量,同时提供足够的容量来解决最需要内存的问题应用程序。该服务器纤薄的 1U 机箱确实将您限制为四个驱动器托架,但 Supermicro 支持大量高容量存储选项以最大限度地利用可用托架。

Supermicro 1024US-TRT 服务器在我们的测试中表现良好,将相当多的线程重量打包成一个可以很好地解决通用、企业、云和虚拟化角色的小尺寸。增加对 Milan-X 的支持还使该平台可用于更多样化的技术计算工作负载,将 1024US-TRT 定位为适合各种角色的强大服务器。

猜你喜欢

转载自blog.csdn.net/weixin_50197960/article/details/126305894
128