Ubuntu サーバーにグラフィック カードが搭載されている nvidia-smi コマンドで問題が表示されない (未解決)

問題の説明:

サーバーには Ubuntu 22.04 システムが再インストールされており、グラフィック カードが 10 枚あります。nvidia-smi を使用すると、グラフィック カードが 9 枚しかないことがわかりました。1 枚のグラフィック カードが表示されなくなり、ドライバーを再インストールしても問題は解決できませんでした。参考ブログ: (600 メッセージ) ubuntu 18.04 Two GPU Graphics Cards, nvidia-smi Only Display one_nvidia-smi Only Display one Graphics Card_Jason.su.ai のブログ - CSDN ブログ

 1. lspci |grep NVIDIA コマンドを使用して、グラフィックス カードの物理接続に問題があるかどうかを確認します。

 10 枚のグラフィックス カードがすべて表示されており、接続に問題がないことがわかります。

2. コマンド ls -l /dev/nvidia* を使用して、nvidia ドライバーが正常かどうかを確認します。

10 枚のグラフィックス カードすべてのドライバーが正常であることがわかります。

3. echo "hello" > /dev/nvidia0 を使用して、通信が正常であるかどうかを確認します。

6 番目のグラフィックス カードで読み取りと書き込みにエラーがあることがわかります。これが発生した場合は、グラフィックス カードが壊れているはずです。1 つが欠けている場合は、1 つが欠けています。問題は解決されていません。解決後にアップデートしてください。

おすすめ

転載: blog.csdn.net/qq_17783559/article/details/130928219