1 つのクラウド、複数のコア、インテリジェントな変革のための次のエンジニアリングの課題

2023 年に入ると、産業のデジタル化とインテリジェントな変革とアップグレードが大規模なエンジニアリングの実装段階に入ります。中国情報通信技術院の「中国デジタル経済発展研究報告(2023年)」によると、デジタル経済は我が国のGDPの41.5%を占めており、これは国家における第二次産業の割合に相当する。経済。産業のデジタル化とインテリジェンスの向上に伴い、コンピューティング パワー サービスはますますデジタル経済の基盤となっています。中国情報通信技術院は、コンピューティング能力への 1 元の投資ごとに 3 ~ 4 元の GDP 経済成長を促進すると推定しています。

いわゆるコンピューティングパワーサービスは、コンピューティングパワーネットワークに接続された多様なコンピューティングパワーに基づいて、効率的なコンピューティングパワーを提供することを目的としたコンピューティングパワー産業です。中国情報通信技術院は、現在のコンピューティングパワーサービスの供給形態は主にクラウドサービスであると同時に、スーパーコンピューティング、インテリジェントコンピューティング、ソーシャルアイドルコンピューティングなどのさまざまなコンピューティングパワーのタスクベースの供給形態も存在すると指摘した。パワーも活発な探求と実験の過程にあります。デジタル世界のオペレーティング システムとして、クラウド コンピューティングはスーパーコンピューティング、インテリジェント コンピューティング、一般的なコンピューティングを調整し、コンピューティング出力の主要なインターフェイスになりつつあります。

チップはコンピューティング能力の基礎です。コンピューティング能力構築プロセスにおける現在のマルチコア状況を解決するために、「1 つのクラウド、複数のコア」という概念が徐々に注目を集めています。中国の主要なプライベート クラウド ベンダーの 1 つである Inspur Cloud のチーフ サイエンティストである Zhang Dong 氏は、2023 年の中国コンピューティング パワー カンファレンスで、「1 つのクラウド、複数のコア」がクラウド コンピューティング プラットフォームの中核機能の 1 つになると強調しました。はコアとクラウドの統合だけでなく、プラットフォーム + エコロジーの相乗効果でもあります。「1 つのクラウド、複数のコア」は、インテリジェントな変革のプロセスにおけるエンジニアリングの課題を効果的に解決し、政府および企業のユーザーが多様なコンピューティング能力で持続可能なインテリジェンスを実現できるように支援します。

コンピューティングパワーが新しいインテリジェントインフラになる

2023 年には大型モデルが爆発的に増加し、コンピューティング インフラストラクチャが新しいインフラストラクチャの最前線に押し上げられるでしょう。OpenAIが発表した「AIとコンピューティング」分析レポートによると、2012年以来、AIトレーニングアプリケーションに必要な計算能力は3.4か月ごとに2倍となり、2012年から現在までにAIの計算能力は30万倍以上に増加している。OpenAI によると、ChatGPT の総計算能力消費量は約 3640PF 日であり、これは現在の巨大都市の総計算能力の 3 倍に相当します。

IDCとInspur Informationが共同で発表した「2022-2023年の中国人工知能コンピューティング能力開発評価報告書」によると、IDCは中国のインテリジェントコンピューティング能力の規模は今後も急速に成長すると予測しており、2026年までにその規模は2026年までに20%に達すると予想されている。中国のインテリジェントコンピューティング能力は1271.4EFLOPSに達し、年間複合成長率は52.3%に達し、同期間の一般コンピューティング能力規模の複合成長率は18.5%となった。コンピューティング能力への投資では、都市のインテリジェントなコンピューティング能力への投資は、地域のデジタル経済の発展を促進するための重要な支援となっており、2022年に中国の人工知能産業のアプリケーション普及率が最も高い上位5業種はインターネット、金融、政府、通信、製造業における AI の普及は大幅に進んでいます。

(Inspur Yunhai の首席研究員、Zhang Dong)

Inspur Yunhai の首席科学者、Zhang Dong 氏は、未来はインテリジェントな競争であり、情報化からインテリジェンスへ移行しなければならない、そうでなければ時代の発展に完全に乗り遅れてしまう、インテリジェント コンピューティング センターは世界の新しいインフラストラクチャである、と強調しました。未来。新しいインフラストラクチャの意義は、商用サービスの提供だけでなく、都市の公共福祉社会インフラサービスとしても機能することであり、大規模モデルのトレーニングなどのタスク固有のインテリジェントコンピューティングのニーズを満たすだけでなく、コンピューティングリソースをオープンにすることもできます。このようにして、知的な才能とエコロジーを幅広く育成することができます。

2023 China Computing Power Conference で、Inspur Information は、現在の業界をリードするインテリジェント コンピューティング センターをデモンストレーションしました。インテリジェント コンピューティング センターは、コンピューティング、ストレージ、ネットワーク、およびコンピューティング パワー スケジューリングを統合するプレハブ型のモジュール式インテリジェント コンピューティング センターであり、さまざまなコンピューティング ノードをカバーし、国内外の主流の CPU および異種アクセラレーション チップと互換性があります。車の運転、バイオ医薬品、AIGC、スマート製造などのデータセンターセットは2週間以内に納品可能で、すでに済南、南京、蘇州などの地域に導入されており、新たな地域インテリジェントインフラの構築を提供している。 、新しい道。

コンピューティング能力を超えて: 標準化されたクラウド オペレーティング システム

当時の PC と同様に、「世界中のすべてのデスクに PC を」を実現する鍵は、各国のさまざまなソフトウェアおよびハードウェア エコシステムとの互換性にあります。現在、さまざまなコンピューティング能力の主な外部出力インターフェイスはクラウド サービスであるため、クラウド オペレーティング システムの互換性を向上させることが、コンピューティング能力サービスの包括性、遍在性、標準化を実現するための鍵となります。AIの発展に伴い、CPUを中心としたコンピューティングシステムから、GPU、DPU、XPUなどの高速化されたコンピューティングチップが共存するコンピューティングシステムへの発展が進んでいます クラウドOSをいかに多様なチップや命令セットに対応させるか上位ソフトウェアが次の課題となります。

Inspur Cloudのチーフサイエンティスト、Zhang Dong氏は、「1つのクラウド、複数のコア」により、異なる種類のチップの共存によって引き起こされるマルチクラウド管理の問題を解決し、真にクラウドを形成する必要があると強調した。「1 つのクラウド、複数のコア」は IT 産業チェーンの重要なリンクとなり、下位ではさまざまな基盤となるチップとオペレーティング システムを管理し、中間ではさまざまな種類の仮想マシン、コンテナ、データベース、ミドルウェアと互換性を持つことになります。クラウドのようなネイティブ アプリケーションとソフトウェアは、将来のクラウド コンピューティング プラットフォームの中核機能の 1 つになるでしょう。

周知のとおり、ビジネス アプリケーション ソフトウェアまたは SaaS サービスは、チップ、オペレーティング システム、データベースなどのさまざまなソフトウェアとハ​​ードウェアの組み合わせ環境に直面する必要があり、さまざまな環境で開発、テストし、さまざまな環境で検証および反復する必要があります。実際のビジネス。今日のマルチコア時代では、さまざまな国やメーカーが独自のチップの開発を続けているため、オプションのプロセッサーの範囲はますます幅広くなり、クラウド オペレーティング システムへの適応要件はますます高くなっています。しかし、各チップメーカーは独自の基準を持っており、独自のエコシステムを促進したいと考えており、その結果、クラウドデータセンター内の各サーバーチップのパフォーマンスは不均一であり、ユーザーエクスペリエンスの一貫性が難しく、アプリケーションの効果が広範囲に及んでいます。異なるため、計算能力の島が形成されます。

したがって、「1 つのクラウド、複数のコア」の最終目標は、異なるアーキテクチャのプロセッサ間でのユーザー サービスの低コストの切り替えまたは自由な切り替えをサポートすることです。言い換えれば、異なるアーキテクチャのプロセッサ間でのアプリケーションの等価な切り替えをサポートするには、アプリケーションとチップ アーキテクチャの完全な分離を達成する必要があります。もちろん、これにはまず、さまざまなチップの計算能力を統一的に測定する必要があります。たとえば、あるメーカーの GPU が別のメーカーの GPU の計算能力を同等に置き換えることができる数については、業界のコンセンサスが必要です。次に、ハードウェア、クラウド、およびアプリケーションなどの産業チェーンの上流と下流の間のコラボレーションにより、アプリケーション レベルでアーキテクチャ間の非認識切り替えが可能になります。第 3 に、開発ツールについては、アプリケーションが次の言語で記述されているかどうかにかかわらず、完全にアーキテクチャに依存することはまだ不可能です。 Python や Java、あるいは多かれ少なかれそれらのほとんどはアーキテクチャに関連しているため、アプリケーション開発をアーキテクチャから独立させ、関連する呼び出しをクラウド オペレーティング システム レベルに剥がして処理する必要があります。データとアプリケーションを完全に分離し、アーキテクチャの独立性を実現することです。

全体として、「1 つのクラウドと複数のコア」はシンプルに見えますが、エンジニアリング上の大きな課題です。「1 つのクラウドと複数のコア」を適切に使用することで、技術的なルート選択のリスクを最小限に抑え、ビジネスの安定性とビジネスの安定性を大幅に向上させることができます。しかし、「1 クラウド、複数コア」を真に実現するには、業界およびエコシステム全体が共通の信念と決意を持ち、標準、アーキテクチャ、評価、テスト、開発などの側面から「1 クラウド、複数コア」を実装する必要があります。では、異なるチップ アーキテクチャのリソース プールを管理する単純なモデルではなく、異なるアーキテクチャのコンピューティング パワー アイランドを真に解体し、異なるアーキテクチャ間の相互接続を実現します。

コンピューティングパワーの統合: 「1 つのクラウド、複数のコア」への 3 つのステップ

クラウド オペレーティング システムは、さまざまなチップ、チップ アーキテクチャ、アプリケーション ソフトウェアと互換性があり、これは巨大で環境に優しいプロジェクトです。エンタープライズ IT テクノロジーの歴史において、VMware の仮想化ソフトウェアであれ、Oracle のデータベースであれ、エンタープライズ IT ソフトウェアの隠れた中核的な競争力は、実際には幅広い互換性です。しかし、VMware や Oracle などの互換性プロジェクトが 1 つのメーカーによって主導され、徐々に実現するまでに長年の時間と投資がかかるのと同じように、より重要なのは、VMware や Oracle などのソフトウェアの市場リーダーシップが認められると、エコシステム全体が積極的にサービスを提供するようになるということです。 VMware や Oracle などのソフトウェアとの互換性。

開発の歴史が短いクラウド オペレーティング システムでは、短期間で広範な互換性を真に実現することは不可能です。Inspur Information は、「1 つのクラウド、複数のコア」を積極的に提唱している企業の 1 つであり、チップ、クラウド、エコシステムから独立したサードパーティ メーカーとして、「アプリケーション指向、システム中心」、「レイヤード デカップリング、オープン スタンダード」を提案しています。 」では、1 つのクラウドと複数のコアの「反復的なイノベーション、継続的な進化」の開発コンセプト、特に「1 つのクラウドと複数のコア」の最終目標を達成するための 3 段階の推進戦略が実践的に提案されています。

いわゆる「3 段階」の推進戦略とは、第 1 段階で異種ノードの統合プール管理が実現され、オフライン移行や手動切り替えなどによりクロスアーキテクチャ アプリケーションが実現されます。これは「ハイブリッド展開、統合」です。 「複数のコアを持つ 1 つのクラウド」の問題を解決します。第 2 段階では、リソース層、プラットフォーム層、アプリケーション層で層状の分離が実現され、メーカーが協力してスムーズなスイッチングと柔軟なスケーリングを実現します。これは、1 つのクラウドで複数のコアを「簡単に」使用できるという問題を解決するための「ビジネスの移行、階層化、デカップリング、アーキテクチャのアップグレード」であり、第 3 段階では、業界チェーンの上流と下流が調整されて標準を作成します。 、共通のエコロジー、および垂直統合ソリューションです。これは、「ソフトウェア デファインド、コンピューティング能力標準、フルスタック マルチコア」で、1 つのクラウドでマルチコアを「最適化」する問題を解決します。

Zhang Dong 氏は、「私たちはまだ「1 つのクラウド、複数のコア」の第 1 段階にいます。多くのメーカーは程度の差こそあれ、「1 つのクラウド、複数のコア」の第 1 段階を達成しています。次のステップは 2 番目の段階に取り組むことです」と述べました。ステージ、つまり階層的な分離は、リソース層、プラットフォーム層、アプリケーション層で実現されます。この目的を達成するために、Inspur Information は最近、サーバー レベルで完全なハードウェア リソースの分離を実現する Fusion Architecture 3.0 プロトタイプを発表しました。Converged Architecture 3.0 は、コンピューティング リソース、ストレージ リソース、メモリ リソース、異種アクセラレーション リソースなどのコア IT リソースを完全に分離およびプールするという画期的な進歩を達成し、複数の汎用プロセッサ プラットフォームと異種 GPU、FPGA、DPU などをサポートできます。ユニットの協調コンピューティングを高速化し、ソフトウェア定義を通じてリソースの協調的かつ動的なスケジューリングを実現します。

Fusion Architecture 3.0 プロトタイプは、以前の「CPU 中心」の設計概念を打ち破ります。全体的な観点から開始し、システム中心です。ハードウェアのデカップリングを通じて、異種コンピューティング、メモリ、ストレージ、その他のリソースを独立して拡張可能なリソース プールに変換します。アプリケーションのニーズに応じてリソースを自由に拡張できます。たとえば、大規模なモデルのトレーニングにはより多くのビデオ メモリが必要ですが、GPU カードのビデオ メモリ容量には制限があります。Fusion Architecture 3.0 の設計では、システム内のすべてのメモリとビデオ メモリを開くことができ、利用可能なメモリが大幅に拡張されます。大規模なモデルのトレーニング用のメモリが削減され、GPU の需要も削減されます。

Incloud OSは「1つのクラウド、複数のコア」に向けた改善の第2フェーズを進めており、特にプラットフォーム層とアプリケーション層でのデカップリングを推進している。Gartner のレポートによると、Incloud OS の中核技術として、クラウド サーバー仮想化システムである Incloud Sphere は中国市場シェアで 2 年連続国内ブランドの中で 1 位にランクされ、現在世界市場シェアでもトップ 4 にランクされています。InCloud Sphereは、x86やARMなど複数の異種チップのコンピューティングリソースプーリングを実現でき、最新バージョンでは4つの異なるアーキテクチャのプロセッサに対する統合管理機能を同時に提供できるようになり、ユーザーが異なるアーキテクチャのインフラストラクチャを維持する困難がさらに軽減されます。

「1 つのクラウド、複数のコア」をコアとしたクラウド プラットフォームのリファレンス ベンチマークを作成するために、Yunhai OS は最近、「1 つのクラウド、複数のコア」シナリオに対する業界初の SPEC クラウド ベンチマーク テストを完了し、3 種類のプロセッサ ノードを混合しました。デプロイメントクラスターテストでは、相対的なスケーラビリティや平均インスタンス構成時間などの指標がすべて世界トップレベルに達し、ビジネスアプリケーションのクロスプロセッサアーキテクチャシナリオにおけるYunhai OSの高効率、高パフォーマンス、高スケーラビリティを検証しました。同時に、Inspur Informationは、中国情報通信技術院が主導する「ワンクラウドマルチコア技術能力標準システム」に積極的に参加し、雲海OSは優れた結果でワンクラウドマルチコアIaaSプラットフォーム能力評価に合格しました。最高レベルの認定「アドバンスレベル」を取得しました。

Inspur Information の「1 つのクラウド、複数のコア」の粘り強い追求は、実際の顧客のニーズから来ています。Yunhai OS は業界で初めて「1 つのクラウド、複数のコア」をサポートしており、産業用アプリケーションの実装において豊富な経験があります。2018 年から、Inspur Information は Yunhai OS を利用して、政府、金融、エネルギー、運輸、その他の業界の何百もの顧客が「1 つのクラウド、複数のコア」の業界クラウドを構築できるよう支援してきました。中国最大の規模と最も多様な種類のチップを搭載し、3 つのプロセッサ アーキテクチャで約 2,000 台のサーバーをカバーし、基本的なソフトウェアとハ​​ードウェア、クラウド プラットフォーム、セキュリティ システム、運用保守管理システム、アプリケーション システム、等

全体: 「1 つのクラウド、複数のコア」は、コンピューティング サービスとクラウド オペレーティング システムが世界的なチップ環境の混乱とサプライ チェーンの不確実性に対処する方法であり、オープン ソースに基づくクラウド オペレーティング システムの方法でもあります。技術を一定の成熟段階まで発展させる唯一の方法です。従来のサーバー仮想化ソフトウェアと比較して、クラウド オペレーティング システムはより複雑なマルチコア環境に直面し、複数の成熟および発展途上のチップ テクノロジ ルートに同時に直面する必要があるため、クラウド オペレーティング システムの製品成熟度に対するより高い要件が求められます。また、この要件により、クラウド オペレーティング システム メーカーは独自のイノベーションを実行し、独立したイノベーションの道を歩むことが求められます。また、「1 つのクラウド、複数のコア」は、中国のインテリジェンスの長期的な持続可能な発展を保証し、世界的なインテリジェンス競争における核となる競争力を確立します。(文/寧川)

おすすめ

転載: blog.csdn.net/achuan2015/article/details/132459539