[NVIDIA GTC 23 カンファレンスの乾物を共有] 人工知能アクセラレーション コンピューティングと科学計算の進歩

[NVIDIA GTC 乾物を共有] AI および科学計算のためのアクセラレーテッド コンピューティングの進歩 (Advances in Accelerated Computing for AI and Scientific Computing)レポート ビデオ リンク

データセンター開発の見通し


データセンターの未来を形作る 3 つのトレンド

  1. エネルギー制約。データセンターは世界のリソースの 2% を消費しており、新しいアプローチでは、パフォーマンスと信頼性を維持しながらエネルギー消費を削減する必要があります
  2. コンピューティングを高速化します。アクセラレーテッド コンピューティングの台頭により、データ センターは変化しています. ムーアの法則の終焉により、従来の CPU はリソースやコンピューティングの需要を満たせなくなり、エネルギー消費とコストが過度に増加します.
  3. AI革命。AI は私たちの生活や働き方をあらゆる面で変えています。基本的な AI モデル多くの新しい製品、アプリケーション、サービス、自動化、パーソナライゼーションをもたらします。

高速コンピューティングには、ソフトウェアとハ​​ードウェアのフルスタック最適化が必要であり、一度に 1 つの特定のアプリケーション ドメイン (分子遺伝学、地震処理、量子化学) しか実行できません。NVIDIA はアクセラレーテッド コンピューティングに 20 年近く投資しており、過去 10 年間で HPC アプリケーションのパフォーマンスを 500 倍に向上させましたが、これは単なるパフォーマンスの問題ではなく、持続可能性

たとえば、世界のトップ 500 のスーパーコンピューターは、膨大な量の電力とエネルギーを必要とします。しかし、アクセラレーション テクノロジを使用することで、NVIDIA は消費電力を大幅に削減し、エネルギー効率を向上させることができました。

新製品紹介


コンピューティング プラットフォーム

AI タスクでは、基礎となるモデルを理解することが非常に重要です. これらの事前トレーニング済みモデルには多くの一般的なスキルがあり、さまざまなアプリケーションを構築するための基礎となります.

ChatGPT は、世界の注目を Al に向ける転機となりました。

Nvidia は、事前トレーニング済みの一連のAI モデルの生成、企業はこれらのモデルをアプリケーション用にカスタマイズして展開できます。GPT モデルは、コンテンツ生成の要約のための感情分析など、さまざまなタスクを実行するのに適しています。

BloomZ などのコミュニティ モデルは、翻訳、自然言語理解、質問応答など、101 の言語でアプリケーションをサポートしますこれらのモデルを使用して、企業は言語理解と質問応答のための生成 AI の採用を迅速に追跡できます. これらのモデルを使用すると、下の図に示すように、ドメインとビジネスの目標に合わせてさまざまな方法でモデルをカスタマイズすることもできます.

ここに画像の説明を挿入
ホッパー GPU
ホッパー アーキテクチャ GPU は、最新の AI および HPC ワークロードを解決する現在の Nvidia コンピューティング プラットフォームの中心です。H100 GPU は、5 つの画期的なイノベーションに加えて、より高速で強力な Tensor コアと NVLink を備えています。Hopper はまた、動的計画法アプリケーションを高速化する新しい DPX 命令を導入しました。Golden Suite は、HPC、AI、データ サイエンスにおける Nvidia の取り組みの進捗状況を測定するために使用されるツールです。H100 は完全に本番環境に導入され、多くのクラウド サービス プロバイダーに採用されています。

H100
BlueField-3
BlueField-3 は現在フル生産中です。CPU コアをオフロードすることで、サーバーのフットプリントを削減し、消費電力を削減します。また、コントロール プレーン アプリケーションと管理プレーン アプリケーションの分離を可能にし、攻撃対象領域を減らします。Bluefield は、仮想化、ネットワーク ストレージ、およびセキュリティ ソフトウェアをオフロードして高速化するために特別に設計されたチップです. BlueField-3 は科学計算を最適化し、そのコアは MPI 集合操作をオフロードして高速化し、競合と通信がリソースを並行して実行できるようにします.

パフォーマンス ツールの
Rescale は、パフォーマンス プロファイルと呼ばれる機能をリリースしました。この機能により、ユーザーは、次の図に示すように、さまざまなコンピューティング、アーキテクチャ、およびスケール レベルにわたってワークロードとパフォーマンスを詳細に可視化できます。色は異なるシステムを表します。赤は X86 CPU システムを表し、青と緑は GPU で高速化されたシステムを表します。このグラフは、Nvidia A100 GPU アクセラレーション システムが最高のパフォーマンスとエネルギー効率を提供すると同時に、電力とコストが最も低いことを示しています。

ここに画像の説明を挿入

私が最近やっているトピックはパフォーマンス分析ツールに関するものなので、この部分は私がより興味を持っているものですこの機能は依然として非常に強力ですが、プログラムの実際の動作で得られた結果ではなく、異なるシステムでの動作のシミュレーションであるべきだと思います。後で詳しく知ることができるかもしれません。

推論プラットフォーム

AI トレーニングに加えて、H100 は Nvidia 推論プラットフォームに使用されています。ジェネレーティブ AI の継続的な採用により、ますます複雑になる推論ワークロードを処理するには、より高度なコンピューティング ソリューションが必要になります。

  1. Triton は、GPU および CPU 向けのマルチフレームワーク推論サービス用のオープンソース ソフトウェアです。対応する TMS (Triton Management System) は、自動化されたリソース効率の高い推論モデルです。
  2. TensorRT は、NVIDIA GPU 向けの高性能ディープ ラーニング推論 SDK です (これは誰もが知っているはずです) TensorRT は最近、GPT-3 ベースの大規模言語モデル向けの GPU マルチノード推論を開始しました。

異なる推論タスク用に 2 つの新しい GPU を発売

  1. ユースケースの 1 つは、ビデオ コンテンツの推論です。Al は、ビデオ コンテンツを理解するために使用され、文字起こしによる拡張現実であり、コンテンツ自体に基づく推論です新しい L4 GPU は、ビデオ転送コーディング、ビデオ コンテンツの理解、AR 向けに最適化されています。
  2. もう 1 つのユース ケースはジェネレーティブ AI です。ジェネレーティブ AI は、画像、ビデオ、テキスト、さらには 3D 生成の日常的なユース ケースで AI の爆発的な普及を促進していますL40 GPU は、安定した拡散イメージの生成などのワークロードで 7 倍以上のパフォーマンスを提供できます

ここに画像の説明を挿入

最後に、Grace Hopper の推論を紹介します.
従来のシステムと比較して、Grace Hopper は 7 倍以上の帯域幅とメモリ容量を提供します。これにより、ベクトル データベースやレコメンデーション システムなどの大容量メモリ ワークロードで最高の推論パフォーマンスが可能になります。一方、Grace CPU は Nvidia GPU と組み合わせて大規模なスケールに対応できるように設計されており、エネルギー効率とデータベースの移動に優れています。

チップ設計

アクセラレーテッド コンピューティングは、チップ自体の設計においても重要な役割を果たします。

フォトリソグラフィーは、チップ製造における重要なプロセスです。課題の 1 つは、非常に難しいタスクであるマスクの計算です。最新のチップで光の干渉パターンをシミュレートするには、毎年数百億の CPU 時間が必要です。私たちは打ち上げを発表しますキュリソは、アクセラレーテッド コンピューティングを計算リソグラフィーにもたらし、TSMC などの半導体リーダーが次世代チップの製造を加速できるようにするライブラリです。従来のCPU法計算との比較を下図に示します

CPU と GPU の計算は時間のかかる比較をマスクします

量子プラットフォーム

量子コンピューティングも大きな可能性を秘めた分野ですが、それを実現するには克服しなければならない重要な課題がいくつかあります。最大のハードルの 1 つは、重ね合わせやエンタングルメントなどの量子特性を利用できる量子アルゴリズムを構築する必要があることです。量子開発者が量子ビット コンピューティングの物理的およびコンピューター サイエンスの課題を理解できるようにするには、新しいワークフローが必要です。

Nvidia は、3 つの部分で構成されるNvidia Quantumプラットフォームを発表しました。

  1. cuQuantum 量子アルゴリズム開発用の高速ライブラリのセット
  2. ヘテロジニアス プログラミングを統合する CUDA Quantum ハイブリッド量子古典コンピューティング プラットフォーム
  3. 量子コンピューティングおよび古典的な量子アルゴリズム アプリケーションを構築するための DGX Quantum System

ここに画像の説明を挿入
Nvidia Quantum プラットフォームは、エラー訂正の協調と制御のためのアルゴリズム、QPU 設計、ハイブリッド アプリケーション開発、GPU との緊密な統合など、複数の問題を解決し、現在複数のベンダーと緊密に連携しています。

要約する


このレポートでは、強力な機能を備えた Nvidia の最近の製品のいくつかについて大まかな概要を説明します。それらは比類のない機能を提供し、AI スーパーコンピューティング時代の生産性を高めます。Nvidia は GPU アクセラレーションの分野で当然のリーダーであり、関連業界の人々は製品と技術の最新情報をフォローアップする必要があります。

私たちは機会の時代に生きており、テクノロジーを通じて達成できる可能性は、人々の想像力によってのみ制限されます!

おすすめ

転載: blog.csdn.net/hug_clone/article/details/129746621