Supermicro 1024US-TRT サーバーのレビュー: 1U シャーシに 128 コア

コンピューティング密度を高める取り組みは続いており、Supermicro の 1024US-TRT「A+ Ultra」シリーズのようなサーバーは、巨大なコンピューティング能力と豊富な接続オプションでこの需要に応えるように設計されています。Supermicro は、エンタープライズ アプリケーション、ハイエンド クラウド コンピューティング、仮想化、テクニカル コンピューティング ワークロードの高密度環境向けに、このスリムな 1U 2 ソケット サーバーを設計しました。このプラットフォームは、32 個の DIMM にまたがる最大 8TB の DDR4 メモリに加え、十分な PCIe 4.0 接続、デュアル 10 GbE LAN ポート、およびフロント ベイの最大 4 台の NVMe デバイスをサポートします。
ここに画像の説明を挿入
このプラットフォームは、デュアル AMD EPYC 7003 および 7002 プロセッサをサポートしています。つまり、EPYC Milan、Milan-X、または EPYC (EPYC) Rome プロセッサをサポートしています。Supermicro の Intel Ice Lake X12 サーバーは、単一のプラットフォームでこれほど多くのコアとスレッドに匹敵することはできません。これは、1024US-TRT がそのポートフォリオの中で最高の密度を提供することを示唆しています。

AMDのEPYC Genoaは、遅れ続けているIntelのSapphire Rapidsと競合するために今年後半に発売され、AMDの継続的な優位性かIntelの復活への布石となる。これらのリリースを待つ間に、いくつかのベンチマークと、いくつかの競争力のある価格帯にわたるデータセンター CPU パフォーマンス階層の現状を見てみましょう。

Supermicro 1024US-TRT サーバー

Supermicro 1024US-TRT サーバーは、1U フォーム ファクターで驚異的な密度を提供します。このサーバーは、それぞれ最大 64 コアの AMD の EPYC 7002 および 7003 プロセッサをサポートします。これは、2 つのソケットにまたがる 128 コアと 256 スレッドに相当します。さらに、このプラットフォームは AMD の Milan-X チップ (BIOS バージョン 2.3 以降) をサポートしており、最大 64 コアと 128 スレッドを備え、かつては想像もできなかった 768 MB の L3 キャッシュを備えています。これらのチップは、1024US-TRT が従来のターゲット市場以外のより多様なワークロードに適応するのに役立ち、技術的なコンピューティング ワークロードにも拡張されます。これには、電子設計自動化 (EDA)、数値流体力学 (CFD)、有限要素解析 (FEM)、構造解析などのワークロードが含まれます。
ここに画像の説明を挿入
1024US-TRT は、サーバー ラックに簡単に設置できる角型ペグを備えた工具不要のレール取り付けシステムを備えており、CSE-819UTS-R1K02P-A シャーシの寸法は 1.7 x 17.2 x 29 インチで、19 インチ ラックにスライドして収まります。

サーバーは最大 280W の CPU TDP に対応できますが、225W を超えるチップを使用するには特別な調整が必要です。したがって、サーバーは 7Hxx シリーズ モデルなどの最も強力な EPYC プロセッサを技術的にサポートできますが、これらの構成を Supermicro で検証する必要があります。

フロントパネルには、さまざまな種類の障害や過熱を示す色付きメッセージライトなどの標準インジケータライトが装備されており、ユニット識別 LED としても機能します。また、ハードドライブアクティビティ、システム電源、および 2 つの LAN アクティビティ LED も含まれます。電源ボタン、リセットボタン、およびユニット識別 (UID) ボタンも前面パネルの右上に表示され、後者のボタンは、梱包されたラック内のユニットの位置を示すためにサーバー背面のライトを点灯します。

デフォルトでは、システムにはツール不要の 3.5 インチ ホットスワップ SATA 3 ドライブ ベイが 4 つありますが、フロント パネルで 4 つの NVMe ドライブを受け入れるようにサーバーを構成できます (SSD は 2.5 インチ アダプタを使用します)。PCIe 4.0 Kioxia 1.92TB をテストしました。 KCD6XLUL1T92 SSD。オプションの SAS カードを追加して、SAS ストレージ デバイスと光学
ここに画像の説明を挿入
ドライブをサポートすることもできます。ケースの上部を外すと、ファンを備えた 2 つのエンクロージャが現れます。合計 8 つのファンがシステムに空気を提供し、それぞれのエンクロージャには 4 つのファンが含まれていますSunon 23,300 RPM 逆回転 40 x 40 x 56 mm ファンにより、静圧を最大化し、振動を低減します。24 時間年中無休で稼働するサーバーに期待されるとおり、ファンに障害が発生した場合でもシステムは動作を継続できます。障害を検出すると、残りのファンが自動的にフルスピードで動作します。ファンの速度とプロファイルは、BMC (BIOS ではなく) を介して管理できます。4 つのファンが各 CPU を冷却し、シンプルな黒いプラスチックのシュラウドが空気をヒートシンクに導きます。
ここに画像の説明を挿入
デュアルSP3 ソケットには、直線的なエアフローに最適化された標準の CPU ヒートシンクで覆われた 2 つのプロセッサが収容されています。

各プロセッサーの両側に合計 16 個のメモリー ソケットがあり、合計 32 個のソケットで最大 8TB の ECC DDR4-3200 メモリー (256GB DIMM 経由) をサポートでき、競合する Intel プラットフォームで使用可能なメモリー容量を簡単に超えます。合計メモリ容量が 256GB の 16 個の 16GB DDR4-3200 SK hynix モジュールを使用して、EPYC Milan プロセッサをテストしました。比較すると、Icl Lake Xeon 比較プラットフォームには、16 個の 32GB SK hynix ECC DDR4-3200 が搭載されており、合計 512GB のメモリが搭載されています。
ここに画像の説明を挿入
H12DSU-iN マザーボードの拡張スロットは、2 つのフルハイト 9.5 インチ PCIe 4.0 x16 スロットと 1 つのロープロファイル PCIe 4.0 x16 スロットで構成され、すべてライザー カードに取り付けられています。追加の内部 PCIe 4.0 x16 スロットもありますが、そのスロットは独自の Supermicro カードのみを受け入れます。
ここに画像の説明を挿入
背面 I/O パネルには、Intel X710-AT2 NIC を搭載した 2 つの 10 Gb RJ45 LAN ポートと、管理用の専用 RJ45 IPMI LAN ポートが含まれています。ここでは、マシン上に 2 つの USB 3.0 ヘッダー (残念ながら前面に USB ポートはありません) と COM および VGA ポートという形式の唯一の USB ポートがあります。
ここに画像の説明を挿入
PMBus を備えた 2 つの 1000 W 80% Plus Titanium クラス冗長電源は、障害発生時の自動フェイルオーバーでサーバーに電力を供給し、ホットスワップ可能なので保守が簡単です。
ここに画像の説明を挿入
BIOS はアクセスと使用が簡単で、CPU 電力しきい値の調整を含む多数の調整可能なパラメーターを提供します。また、IPMI Web インターフェイスは、他の種類のプラットフォームで利用できる機能の種類に一致する広範な監視機能と簡単なリモート管理を提供します。多くのオプションの中から、BIOS の更新、KVM-over-LAN リモート コンソールの使用、消費電力の監視、正常性イベント ログへのアクセス、ファン速度の監視と調整、CPU、DIMM、チップセットの温度と電圧の監視を行うことができます。Supermicro のリモート管理スイートはエレガントで使いやすいです。
ここに画像の説明を挿入

テスト設定

私たちがテストしている 240W 64 コア EPYC 7713 は、AMD の EPYC Milan シリーズの中で最高周波数の 64 コアではありません。違いは、64 コア EPYC 7763 のベース周波数が 2.45、ブースト クロック周波数が 3.5 GHz であり、TDP が 280 W であることです。この EPYC チップを、同じく 270W TDP が高い Ice Lake のフラッグシップ Xeon Platinum 8380 と比較するときは、その点に留意してください。
ここに画像の説明を挿入
EPYC 7713 Milan プロセッサのテストには Supermicro 1024US-TRT サーバーを使用し、4 つの異なる EPYC Rome 構成のテストには Supermicro 1024US-TR4 サーバーを使用しました。

Intel 2U サーバー システム S2W3SIL4Q ソフトウェア開発プラットフォームと Coyote Pass サーバー ボードを使用して、Ice Lake Xeon Platinum 8380 プロセッサをテストしました。このシステムはエアフローが高度に最適化されており、8 つの 2.5 インチ ストレージ ベイが大きな空のベイに隣接して十分なエアフローを実現します。

テストには Phoronix テスト スイートを使用します。この自動テスト スイートにより、Linux 環境での複雑なベンチマークの実行が簡素化されます。テスト スイートは Phoronix によって保守され、必要な依存関係がすべてインストールされます。テスト リポジトリには 450 のベンチマークと 100 のテスト スイート (さらに増加中) が含まれています。Phoronix は、テスト結果を中央データベースにアップロードするためのオンライン リポジトリである http://openbenchmarking.org も管理しています。以下のすべてのテストでは、デフォルトの Phoronix テスト構成と GCC コンパイラーを備えた Ubuntu 20.04 LTS を使用します。また、利用可能なすべてのセキュリティ緩和策を適用して両方のプラットフォームをテストしました。

Linux カーネルと LLVM コンパイルのベンチマーク

1024US-TRT のデュアル EPYC 7713 プロセッサは、時限 Linux カーネル コンパイル ベンチマークを完了し、デフォルト設定で Linux カーネルを構築するのにわずか 19 秒で Xeon Platinum 8380 を上回りました。これは驚くべきことです。7713 の TDP は 225 W であり、これは低周波数の 64 コア EPYC バージョンであることを意味します。比較すると、Ice Lake チップの TDP 定格は 270 W です。AMD のミラノのフラッグシップ製品である 7763 が、このベンチマークでリードすることになります。
ここに画像の説明を挿入AMD の EPYC 7713 は、Timed LLVM Compilation ワークロードでも 8380 を上回り、テストを 178 秒で完了しました。また、後者が低周波数バージョンであることを考慮すると、EPYC 7742 から 7713 へのパフォーマンスのスケーリングは予想よりも顕著であり、7713 は前世代のフラッグシップよりも 10% 速くベンチマークを完了しました。

分子動力学と並列コンピューティングのベンチマーク

NAMD は、追加のコンピューティング リソースに合わせて適切に拡張できるように設計された並列分子動力学コードで、500,000 コアまで拡張でき、シミュレーション コードでパフォーマンスを定量化するために使用される主要なベンチマークの 1 つです。EPYC プロセッサは、その驚異的なコア数により、この種の高度な並列ワークロードに最適ですが、Intel の Ice Lake も無視できない力です。このワークロードは、拡張されたワークロードによってコアが完全に飽和することによって大きな熱負荷を引き起こしますが、Supermicro 1024US-TRT には熱がパフォーマンスに影響を与える兆候は見られませんでした。もう一度言いますが、EPYC 7713 は、Intel のより高い TDP フラッグシップに対して優れた印象を与えます。
ここに画像の説明を挿入
Stockfish は、コアの数を増やすことで最大のスケーラビリティを実現するように設計されたチェス エンジンで、最大 512 スレッドまで拡張できます。ここでは、EPYC 7713 がベンチマーク チャートのトップに立っており、この超並列コードが非常にうまく拡張されていることがわかります。

レンダリングベンチマーク

64 コアの EPYC Milan プロセッサと EPYC Rome プロセッサは、この一連のベンチマークで説得力を持ってリードしていますが、Intel の Ice Lake は一部の Blender レンダリングでは競争の場を狭め、他のレンダリングではリードしています。

エンコーダはさまざまな課題を引き起こす傾向があります。VP9 libvpx ベンチマークで確認したように、エンコーダは通常、コアの数に合わせて適切に拡張できません。代わりに、通常はコアあたりのパフォーマンスやキャッシュ容量などの他の要素から恩恵を受けます。ここでは、Intel の 8380 が僅差でリードしていることがわかりますが、AMD の EPYC Milan 7713 は、消費電力と熱バジェットがはるかに低いため、信じられないほど優れています。
ここに画像の説明を挿入
ここに画像の説明を挿入
ここに画像の説明を挿入

圧縮とセキュリティ

圧縮ワークロードにもさまざまな形式があります。たとえば、7-Zip (p7zip) ベンチマークは、メイン メモリから直接動作し、メモリ スループットとコア数がパフォーマンスに大きな影響を与えるため、理論上の圧縮パフォーマンスの高さを明らかにしています。ここでは、EPYC 7713 が 8380 よりも優れているため、大きなメリットがあることがわかります。対照的に、Linux 4.13 カーネル ソース ツリーの 2 つのコピーを圧縮する gzip ベンチマークは、高速クロック レートによく反応する傾向があり、16 コア EPYC 7F52 が有利なスタートを切ります。それでも、7713 が 2 位になったのは印象的です。
ここに画像の説明を挿入
オープン ソースの OpenSSL ツールキットは、SSL および TLS プロトコルを使用して RSA 4096 ビットのパフォーマンスを測定します。これまで見てきたように、このテストでは並列化の性質により EPYC プロセッサーが有利ですが、要求の厳しい環境では、このタイプのワークロードを専用アクセラレーターにオフロードすることがより一般的になりつつあります。

結論は

EPYC 製品ラインが成熟するにつれて、AMD の先進的な SP3 ソケット設計はサーバー メーカーに十分な柔軟性を提供し、Supermicro 1024US-TRT サーバーはこの機能を十分に発揮します。EPYC 7002 および 7003 プロセッサ、高周波数 H シリーズおよび F シリーズ、さらには Milan-X CPU のサポートにより、プラットフォームは成長を続ける EPYC ラインナップをサポートするために進化し続けています。

Supermicro の完全に検証されたシステムには、完全に構成されたハードウェアが付属しており、工具不要のレール キットを使用して迅速かつ簡単にラックに取り付けることができます。私たちのテストでは、このシステムは非常に強力で、プロセッサーに十分な電力を供給し、高品質のチタン電源を搭載し、8 つのファンによって十分な冷却を提供することがわかりました。重大な熱負荷を生成する長時間にわたる多数のオールコア ワークロード中、発熱による悪影響は見られませんでした。これは、冷却システムが適切に設計されていることを示唆しています。

ハードウェア側では、デュアル 10GbE LAN および PCIe 4.0 インターフェイスが豊富な接続オプションを提供し、最大 8TB の ECC メモリのサポートにより、サーバーは最もメモリを必要とするアプリケーションに十分な容量を提供しながら、EPYC Milan の巨大なスループットを活用できます。プログラム。サーバーのスリムな 1U シャーシではドライブ ベイが 4 つに制限されていますが、Supermicro は利用可能なベイを最大限に活用するために、多数の大容量ストレージ オプションをサポートしています。

Supermicro 1024US-TRT サーバーはテストで良好なパフォーマンスを示し、汎用、エンタープライズ、クラウド、および仮想化の役割に適切に対応する小さなフォーム ファクターにかなりの量のスレッド重量を詰め込みました。また、Milan-X のサポートの追加により、このプラットフォームはより多様な技術的なコンピューティング ワークロードに使用できるようになり、1024US-TRT はさまざまな役割のための強力なサーバーとして位置付けられます。

おすすめ

転載: blog.csdn.net/weixin_50197960/article/details/126305894