[チュートリアル] CPUおよびGPUアーキテクチャのトポロジとシステム情報を表示する

転載する場合は出典を明記してください:Xiaofeng先輩のBig Bang Life [xfxuezhang.cn]

いくつかの概念

  • パッケージ: プロセッサーパッケージ。マルチプロセッサ システムでは、各物理 CPU チップは通常、パッケージと呼ばれる個別のパッケージにパッケージ化されます。パッケージには 1 つ以上の物理 CPU コアを含めることができます。通常、各パッケージは 1 つ以上のメモリ コントローラに接続され、システム メモリへのアクセスを提供します。
  • NUMA ノード: NUMA ノード。NUMANode は、NUMA アーキテクチャにおける重要な概念です。NUMA アーキテクチャでは、システム メモリが複数の NUMA ノードに分割されます。各 NUMA ノードには、システム メモリの一部とそれに関連付けられた CPU コアのセットが含まれています。NUMA ノードは、メモリ コントローラーやキャッシュなどの特定の物理リソースを共有するプロセッサとメモリの論理的な組み合わせです。
  • ソケット:ソケット。通常、物理 CPU チップのソケットまたはソケットを表すために使用されます。これは、CPU チップが挿入されるマザーボード上の物理インターフェイスです。家庭用 PC には通常 1 つのソケットがあり、サーバーは通常 2 つのソケットをサポートしますが、4 つまたは 8 つのソケットもサポートします。通常、異なるソケットは高速バスによって接続されます。
  • NUMA アフィニティ: NUMA アフィニティ。タスクまたはプロセスを特定の NUMA ノードに関連付ける機能を指しますNUMA アフィニティを設定すると、タスクが特定の NUMA ノードで実行されるように指定して、リモート メモリ アクセスを最小限に抑え、パフォーマンスを向上させることができます。タスクが特定の NUMA ノードに関連付けられている場合、そのノードに関連付けられているローカル メモリが使用される可能性が高くなります。ローカル メモリは、タスクが実行されているのと同じ NUMA ノード上の CPU に関連付けられたメモリです。このローカル メモリ アクセスは CPU に直接接続されているため高速ですが、リモート メモリ アクセスはノード間のメモリ相互接続を介してアクセスする必要があるため低速です。
  • CPU アフィニティ: CPU アフィニティ。特定のコンピューティング タスクまたはプロセスを特定の CPU コアまたは CPU グループに関連付ける機能を指します。これは、実行するタスクをどの CPU コアまたは CPU コアのグループに割り当てるかを指定するために使用されます。CPU アフィニティを設定すると、マルチコア システムでタスクをスケジュールおよび実行する方法を制御して、パフォーマンスを最適化したり、特定のニーズを満たすことができます。
  • ルート コンプレックス: PCIe バス構造のトップレベルのホスト ブリッジ通常、CPU チップ上にあり、CPU を GPU、ネットワーク カード、ストレージ コントローラーなどの他のデバイスに接続する役割を果たします。ルート コンプレックスは PCIe バス階層全体の開始点であり、PCIe を介して他のデバイスまたはブリッジに接続され、拡張 PCIe ネットワークを形成します。ルート コンプレックスは、PCIe バスのコントローラーとして機能し、PCIe バスを介したデータ フローの相互作用を管理および調整します。異なる PCIe デバイス間のデータ転送と通信を担当し、アドレス割り当てと DMA (ダイレクト メモリ アクセス) リクエストを処理します。

  • PCIe : コンピュータ システム内のさまざまな外部デバイスや拡張カードを接続するために使用される高速シリアル拡張バス規格です。これは、PCI バスの進化と置き換えです。PCIe バスはシリアル データ送信を使用します。これは、パラレル送信される PCI バスよりも高い帯域幅と低い遅延を備えています。これは現代のコンピュータ システムで一般的に使用されている接続標準であり、GPU、ネットワーク アダプタ、ストレージ コントローラ、サウンド カードなどのさまざまなデバイスの接続に使用されます。PCIe 標準は、PCIe x1、PCIe x4、PCIe x8、PCIe x16 などのさまざまな物理スロット サイズとバージョンを定義し、さまざまな数の物理レーンと帯域幅を表します。PCIe は、より高いパフォーマンスのニーズとシステム構成に対応するため、複数世代のリンクとマルチレベル トポロジもサポートします。

トポロジー

  • NUMA ノード、ソケット、コア、ソケットあたりのコア数、コアあたりのスレッド数などを確認します。
lscpu

したがって、物理スロットが 2 つ + CPU が 2 つあり、各 CPU がスロットに挿入されます。各 CPU には 20 コアがあり、各コアには 2 つのハイパースレッドがあります。マザーボードのモデルは Intel で、NUDA はシリアル番号付け方式を使用し、各 NUMA ノードは 2 つの CPU コア グループに割り当てられます。

  • GPU トポロジを表示する
nvidia-smi topo -m

したがって、GPU0、GPU1、および GPU2 は同じ PCIe スイッチに接続され、GPU3、NIC0、および NIC1 は別の PCIe スイッチに接続されます。さらに、2 つの PCIe スイッチは、同じ CPU の 2 つのルート コンプレックスの下に接続されています。

  • GPU 情報の表示
nvidia-smi

  • GPU の PCIe バージョンを表示する
nvidia-smi -q

  • ハードウェア接続を表示する
sudo apt install hwloc
lstopo

システムメッセージ

sudo apt install hardinfo
hardinfo

システムのさまざまなハードウェア情報を表示できます。

おすすめ

転載: blog.csdn.net/sxf1061700625/article/details/131887534
おすすめ