7,199 元からの Nvidia RTX 40 シリーズ グラフィックス カードがついに登場: 基本性能が 2 倍、光の追求が 4 倍になりました

この記事は、Zenan と Du Wei によって編集された、マシンの中心部からの転載です。

最もハイエンドの RTX4090 が最も費用対効果が高いとは思いませんでしたか?

製品が高すぎるため苦情が寄せられましたが、最強の AI チップとハイエンドのゲーム用 GPU となると、人々は今でも Nvidia を真っ先に思い浮かべます。9月20日の夜、GTCカンファレンスがオンラインで開催され、待望のRTX 40シリーズグラフィックスカードがついに正式リリースされました。

これまでとは少し異なり、この重要な基調講演は気取らず「短い」ようで、黄仁勲氏は空のメタバースに直接立ち、次のようにスピーチしました。

867fd1d3896de1c4c0d8105ddf39e1ec.gif

1日と呼ぶには1時間半。

このイベントで、Nvidia は、RTX、AI チップ、Omniverse 製品ラインの最新開発をデモンストレーションしました。これには、人工知能や多数のアプリケーションの分野における新たなブレークスルーへの貢献も含まれます。

すべてが始まる前に、Lao Huang 氏は最初に、Omniverse で構築され、多くの物理マテリアル特性、レイ トレーシング、煙、炎を備えた完全にインタラクティブなシミュレーション環境 RacerX を披露しました。最も重要なことは、「すべてが事前レンダリングされず、単一の GPU で実行される」ということです。

ee08754f8dd8284dad043067d2315090.gif

Huang Renxun 氏は、すべてのリアルタイム処理が将来のゲームのあるべき姿であると述べました。

RacerX を購入できる最新の RTX 40 シリーズ グラフィックス カードである必要があります。AMD は新世代の GPU をリリースしようとしていますが、今回は Nvidia が先を行くのでしょうか? Nカードの性能が強い場合、コストはいくらですか?

RTX 40 シリーズ GPU: パフォーマンスが 2 倍、ライト トレース機能が 2 倍に

これは、新しい Ada Lovelace アーキテクチャを使用するNvidia の第 3 世代 RTX グラフィックス カードです

b05cd5900484eff4bd4999b587d94f60.gif

Nvidia が TSMC に切り替えた後、カスタマイズされた 4N プロセスを使用する RTX40 シリーズ GPU には、前世代のアンペアより 70% 多い 760 億個のトランジスタが搭載されました。

bd1b2bdc725b419224c1f43fd040c3e5.jpeg

25 年前、NVIDIA はプログラマブル シェーダー GPU の導入により、コンピューター 3D グラフィックスの世界に革命をもたらしました。2018 年までに Nvidia は RTX アーキテクチャを発表し、新しく追加された RT コアはリアルタイム レイ トレーシングの高速化に使用され、Tensor コアは行列演算の処理に使用され、前例のない結果を達成しました。リリースされたばかりの Ada Lovelace アーキテクチャでは、以下の 3 つのプロセッサすべてが改良および強化されています。

1. SM ストリーム プロセッサは、シェーダ実行記録を追加します。これにより、リアルタイムでタスクを再スケジュールでき、ライト トレースの速度が 2 ~ 3 倍向上し、4090 で前世代の 2 倍のパフォーマンスである 90TFLOPS を出力できます。

2. 第 3 世代 RT コアは、光線と三角形の交差パフォーマンスを 2 倍に達成します。新しい Opacity Micromap エンジンは、アルファ テストのジオメトリ パフォーマンスを 2 倍にします。Micro-Mesh エンジンは、BVH の消費量を増やすことなく、ジオメトリの豊かさを向上させることができます。建設および保管リソース。

3. 新しい第 4 世代 Tensor コアは、  1.4 ペタフロップスの計算能力を達成し、AI パフォーマンスを 2 倍にします

00e8c78513655b5cf2c8370b064fdaf9.jpeg

「シェーダー実行記録は、当時の CPU のアウトオブオーダー実行と同様、大きな革新です」と Huang Renxun 氏は述べています。「レイ トレーシングは並列処理が難しく、GPU は並列性が高くなります。SER はシェーダーの負荷をリアルタイムに再配置することで効率を向上させ、レイ トレーシングのパフォーマンスを 2 ~ 3 倍、ゲームのパフォーマンスを 25% 向上させることができます。」

しかし、私たちは、レイ トレーシングが、かつて Nvidia の元主任研究員である David Krik 氏によって「決して実現しない」テクノロジーであると述べたことを知っています。パフォーマンスを 2 倍にしても、今日のさまざまな大規模スタンドで GPU が高いフレーム レートを維持することはできません。 -アローンゲーム 現時点では AI アルゴリズムが必要です。

DLSS は畳み込みオートエンコーダー AI モデルを使用しており、GPU から出力された低解像度画像に基づいて高解像度画像を自動的に生成できるため、パフォーマンス要件が大幅に軽減されます。Nvidia は、Ada アーキテクチャに DLSS 3 を導入しました。これにより、解像度を高めながらフレームを自動的に補完できます。DLSS 3 は、新しいオプティカル フロー アクセラレータ、ゲーム エンジン モーション ベクトル、畳み込み自動コーディング AI フレーム ジェネレーター、および Reflex Low Latency Pipeline の 4 つのコンポーネントで構成されています。

DLSS 3 は、現在のフレームと前のフレームを同時に処理します。オプティカル フロー アクセラレータは、動きの方向と速度の情報をニューラル ネットワークに提供します。グラフィックスとピクセルの動きベクトルと組み合わせて、ニューラル ネットワークに入力して生成することができます。中間フレームです。

「DLSS 3 はグラフィックス パイプライン処理を行わずに新しいフレームを生成するため、純粋なレンダリングと比較してパフォーマンスを最大 4 倍向上させることができます」と Huang Renxun 氏は述べています。「そして、CPU または GPU がボトルネックになっているゲームは、その恩恵を受けることができます。」

Nvidia は、DLSS 3 を使用した Cyber​​punk 2077 や Microsoft Flight Simulator などのゲームの実行効果を示しました。

373ba48d271471c1c84df1ba389d6f92.gif

過去 4 年間で RTX データ量は 16 倍に増加し、一部のピクセルは計算され、そのほとんどが AI によって推測されるようになりました。

デモでは、いくつかのゲームが直接 2 倍されます。ただし、DLSS 3 は新しいハードウェア機能に強く依存しており、30 および 20 シリーズのユーザーはそのようなパフォーマンスを享受できないことに注意してください。

Nvidia は 40 シリーズ グラフィックス カードの一般的なハードウェア仕様を多数発表しました: RTX 4090 は AD102 GPU を使用し、16384 個の CUDA コアと 24GB GDDR6X ビデオ メモリを備え、デフォルトの TDP は 450W です; RTX 4080 16GB バージョンは 9728 個の CUDA コアを備え、TDP は 320W です; RTX 4080 12G バージョンには 7680 CUDA コアと 285W の TDP が搭載されています。消費電力の観点から見ると、Samsung 8nm プロセスから TSMC 4N プロセスへの切り替え効率が大幅に向上し、同レベルのパフォーマンスが向上し、電源要件も増加していません。

前世代と比べてどれくらい性能が向上しましたか?SER の最適化、大規模チップ、および 1.7 GHz から 2.52 GHz のチップの加速周波数により、この組み合わせにより、RTX 4090 のパフォーマンスは 3090Ti と比較して 2 倍になります。レイ トレーシングで見ると、パフォーマンスは 2 倍向上します。 4回。Huang Renxun 氏は、Ada の同じ消費電力性能は Ampere の 2 倍であると述べました。

cfb541e7db9a1e977cfb021c5e9aaddf.jpeg

さらに、DLSS がオンになっている場合、RTX 4080 は 3080Ti の 2 倍のパフォーマンスを達成できます。

最後に、価格: RTX 4090 パブリック バージョンの価格は 1,599 ドルで、10 月 12 日に発売されます。RTX 4080 16GB の価格は 1,199 ドル、12GB バージョンの価格は 899 ドルです。

結論から言うと、90の価格はほとんど上がっておらず、80の価格は500ドル上がっています。国内ユーザー向けのRTX 40シリーズの価格は次のようになります。4090が12999元から、4080(16GB)が9499元、4080(12GB)が7199元です。

RTX 4090の非公開版の価格は15,000程度になるようです。

bcb2d95dd300762cf2a396f30ae89eb7.jpeg

ただし、この世代のグラフィックス カードについて注意すべき点が 1 つあります。4080 の 12G バージョンでは、元の 70Ti の名前が変更されたようです。

NVIDIA Omniverse が 3D 世界を接続します

GPU と AI に加えて、Nvidia はメタバースのリーダーでもあり、Huang Renxun は一連のオムニバースの進歩を紹介しました。

Omniverse は、デジタル世界と物理世界が交わる場所で機能するメタバース アプリケーションを構築および実行するための NVIDIA のプラットフォームです。Omniverse は、共有可能な 3D 世界を構築するためのリアルタイムの大規模 3D データベースでもあります。Omniverse はむしろ、その上で実行されるアプリケーションを作成できるコンピューティング プラットフォームであり、それらのアプリケーションは仮想世界へのポータルになります。

e7d9e64ea7c93603573d9798da17004f.gif

本日、Jen-Hsun Huang 氏は、Ada Lovelace GPU をサポートし、レイ トレーシングと大規模シーンのパフォーマンスで大きな飛躍を達成した、Omniverse プラットフォームの一連のメジャー アップデートをリリースしました。

まずは、GAN と拡散モデルに基づく新しいニューラル レンダリング ツールです。OmniGraph は、動作、モーション、アクションを手続き的に制御するグラフ レンダリング エンジンです。

3e47f4cb8f477761c3df18fa5403bee7.gif

2 つ目は、Omniverse Physics のメジャー アップデートで、複雑な複数接続されたパーツ オブジェクトの動きを処理するために使用できます。

fd5c591b45541e169f20d0564ab42dc5.gif

さらに、VR で Ada の強力なレイ トレーシング機能を有効にするまったく新しい Cloud XR があります。データ生成とデジタル ツイン シミュレーション用の初の SimReady マテリアル ライブラリもあります。

72591caf61dad0aac43753ff82af5bf3.gif

Replicator は、自動運転車、ロボット、さまざまなコンピューター ビジョン モデルをトレーニングするための合成データを生成するために使用される人気のある Omniverse アプリの 1 つです。最後に、新しい Omniverse JT コネクタが登場しました。これは、Omniverse を業界や製造業が利用できるようにする大規模なアプリケーションです。

8c1923d9aed1dfeccddc4a2fe55885d7.gif

Omniverse は、製品のデザインやスタイリングからエンジニアリング、製造、マーケティング、運用に至るまで、製品ライフサイクル全体を対象としたエンタープライズ プラットフォームであると言えば十分でしょう。インターネットが Web サイトに接続したように、オムニバースは 3D 世界を接続しました。

Huang Renxun 氏は会議で、一部の企業が Omniverse を使用して工場、物流倉庫、自動生産ライン、産業プラント向けのデジタル ツインを作成する方法を紹介しました。以下のシナリオから 1 つか 2 つのことを学ぶことができます。

790f1c6be74cdf87feaa631e9d71776c.gif

34514b468b1bdad5f7af8fdda1bcfe8e.gif

Omniverse コンピューティング プラットフォームは、クリエイター、デザイナー、エンジニアが使用する RTX コンピューター、Nucleus データベースへの接続をホストし、仮想世界シミュレーションを実行する OVX サーバー、そして Omniverse へのポータルである NVIDIA GDN の 3 つの部分で構成されています。

NVIDIA は、GeForce Now を通じて、グローバルなグラフィック配信ネットワーク (GDN) を構築しました。100 の地域をカバーするこのネットワークは、応答性の高い超高速 RTX グラフィックス コンテンツ配信ネットワーク (つまり CDN) を提供し、インターネット ビデオを効率的にストリーミングします。一方、NVIDIA GDN は、インタラクティブ グラフィックスを効率的にシリアル化し、クラウド上で NVIDIA RTX PC と NVIDIA GPU を組み合わせて、グローバルな Omniverse コンピューティング プラットフォームを作成できます。

462bc5fdee64a94c2e5aacba61e4afa9.png

NVIDIA Omniverse Cloud は、いつでも、どこでも、あらゆるデバイスで Omniverse アプリケーションを設計、公開、体験するためのソフトウェアおよびサービスとしてのインフラストラクチャのスイートです。Jen-Hsun Huang は、スーパーカーおよび先進的な電気自動車ソリューションのパイオニアである Rimac が、Omniverse Cloud を使用して 3D チームの共同ワークフローを実現し、ユーザーに高度な 3D エクスペリエンスを提供する方法を紹介しました。

79573f657c279285977b34c95e715067.gif

Huang Renxun 氏は、NVIDIA Omniverse Cloud はローカルで単一のデバイス上でクラウドに接続して Omniverse アプリケーションを実行できる IaaS 製品であると述べました。レプリケーターとファームはクラウド上でも実行できます。ファームはレンダリング ファーム用の拡張エンジンです。現在、ユーザーは AWS でレプリケーターとファームのコンテナーを使用できます。

9f862748515735746df8fc2d2d8c099d.png

新世代の自動運転チップ Drive Thor

自動運転の分野では、自動車会社はより強力なコンピューティング能力を必要とし、各世代の Nvidia 製品のパフォーマンスを 2 倍にする必要があります。

現在、インテリジェントマシンの開発によりAIの波が起こり、ディープラーニングの参加によりシステム機能の向上に新たな扉が開かれています。ソフトウェアの開発方法から実行方法まで、すべてが劇的に変わります。したがって、新世代のプロセッサを作成することが不可欠です。NVIDIA Xavier は、ディープ ラーニング用に設計された世界初の自動運転スーパー チップであり、それ以来 2 年ごとにプロセッサのパフォーマンスが大幅に向上しています。

同時に、自動運転の分野を拡大し、運転の安全性を向上させるために、センサーの数と解像度も同時に増加する必要があります。同時に、より複雑な AI モデルが導入され、これらすべてが Nvidia の継続的なパフォーマンス向上を推進します。

2021 年に、Nvidia は 1000 TOPS SoC-Atlan を発売しました。本日、ジェンセン・ファン氏は、その地位をソーが引き継いだと述べた。Thor は Atlan の 2 倍のスループットと 2 倍以上の配信パフォーマンスを備えていますこれらの目標を達成するには、Grace、Hopper、Ada Lovelace の 3 つの要素から切り離すことができません。そのうち Grace は、驚くべき Transformer エンジン、ViT の急速な変化を提供し、Ada のマルチインスタンス GPU は、オンボード コンピューティング リソースの集中化に役立ち、コストの削減をもたらします。数百ドル単位で。

0e85f4a78e22d3f925a23edc2c2b8161.png

Nvidia Drive Thor は多くの新しいテクノロジーを採用しており、自動運転ワークフローに 2000 TOPS と 2000 TFLOP を最大限に活用するために複数のモードで構成できます。また、部分的にはコックピット AI とインフォテインメント用に、部分的には運転支援用に構成することもできます。Thor のマルチコンピューティング ドメイン分離により、時間に敏感なマルチプロセスを中断することなく同時に実行できます。Linux、QNX、Android を 1 台のコンピューターで同時に実行できます。

さらに、Thor は多くのコンピューティング リソースを集中させ、機能の飛躍を達成しながらコストと消費電力を削減します。現在、自動車の駐車、予防安全、ドライバー監視、カメラミラーリング、クラスター、インフォテインメントはすべて、さまざまなコンピューティングデバイスによって制御されています。将来的には、これらの機能は個別のコンピューティング デバイスによって制御されるのではなく、Thor 上で実行され、時間の経過とともに改善されるソフトウェアによって制御されるようになります。

Thorチップは2025年に自動車に使用されると予想されている。

d6864a813477701e2805a62a808622ee.png

NVIDIA Drive は、自動運転車の開発と導入のためのエンドツーエンドのプラットフォームです。これには、開発側のレプリケーター合成データ生成、ドライブ シムとドライブ マップ、フルスタックの運転および車載 AI アプリケーション、AI が含まれます。コンピューターと Hyperion 自律走行車リファレンス アーキテクチャ。

30a0be5f25a675387c57584f62e75130.png

NVIDIA Drive は、Drive Sim の主要な機能となった Neural Reconstruction Engine と呼ばれる AI ワークフローを皮切りに、一連の機能アップデートを導入しました。記録されたセンサー データから 3D シーンを構築し、Drive Sim にインポートした後、人間が作成したコンテンツまたは AI が生成したコンテンツで強化できます。さらに、このビデオから 3D ジオメトリへのワークフローは OVX システム上で実行できます。

a7dca1689b827d855e28eb01b73345f9.gif

ビデオから 3D ワークフローまでのダイナミックなプレゼンテーション。

Drive Sim のもう 1 つの重要な機能はハードウェアインザループです。これは、車載ソフトウェア スタック全体を AI ファクトリーで実行できることを意味します。また、車内の環境をシミュレートすることもでき、将来の自動車には単純なダッシュボードだけでなく、デジタル設計と物理設計を組み合わせたサラウンドディスプレイが搭載され、自動車エンジニア、ソフトウェアエンジニア、電子エンジニアがドライブで共同作業できるようになります。 Sim、すべての実際のコンピューターとソフトウェア スタックを同時に実行します。

4e4362016fbbd5cd46af97706a4e8f28.gif

Drive Sim は仮想デザイン スタジオになります。

さらに、NVIDIA は、Replicator 合成データの生成、AI モデルの改善、Drive Map 自動運転フリート マップの構築、都市部および高速道路での運転、およびパーキング。

8745346f02f8e62e1ad03ac4f461a470.gif

Drive Map の自動運転フリート マップの構築。

新しいマイクロロボットシステムオンモジュール

Nvidia の第 2 世代自動運転車コンピューティング チップである Drive Orin は、これまでのところ非常に成功しているようで、40 台以上の乗用車、トラック、無人タクシーに使用されています。Nvidia のロボット コンピューターである Jetson には 100 万人の開発者がおり、約 6,000 社で使用されています。

本日の GTC カンファレンスで、Huang Renxun 氏は、以前の Jetson Nano より 80 倍高速なマイクロロボット システムオンモジュール チップ Jetson Orin Nano の発売を発表しました。Jetson Orin Nano は、NVIDIA Isaac ロボット スタックを実行でき、ROS 2 GPU アクセラレーション フレームワークを備えています。

c3dba90204da762f2bb384f5f83deb9f.png

Huang Renxun 氏はまた、カメラ、LIDAR、その他の IoT センサーからのデータを解釈して、倉庫、工場、小売店、都市の安全性と効率性を向上させることができるエッジ AI プラットフォームである Metropolis も紹介しました。

産業から科学研究、自動運転からメタバースまで、Nvidia のビジネスはすでに GPU から数え切れない分野に拡大しており、多くの場所で主導的な地位を占めています。一般の消費者にとって、グラフィックス カードはもはやゲームのプレイには使用されません。

新世代の GPU が発売された今、値下げ後の RTX30 を選択しますか、それとも古いものではなく新しいものを購入しますか?

おすすめ

転載: blog.csdn.net/u014333051/article/details/126984121