問題の説明:
サーバーには Ubuntu 22.04 システムが再インストールされており、グラフィック カードが 10 枚あります。nvidia-smi を使用すると、グラフィック カードが 9 枚しかないことがわかりました。1 枚のグラフィック カードが表示されなくなり、ドライバーを再インストールしても問題は解決できませんでした。参考ブログ: (600 メッセージ) ubuntu 18.04 Two GPU Graphics Cards, nvidia-smi Only Display one_nvidia-smi Only Display one Graphics Card_Jason.su.ai のブログ - CSDN ブログ
1. lspci |grep NVIDIA コマンドを使用して、グラフィックス カードの物理接続に問題があるかどうかを確認します。
10 枚のグラフィックス カードがすべて表示されており、接続に問題がないことがわかります。
2. コマンド ls -l /dev/nvidia* を使用して、nvidia ドライバーが正常かどうかを確認します。
10 枚のグラフィックス カードすべてのドライバーが正常であることがわかります。
3. echo "hello" > /dev/nvidia0 を使用して、通信が正常であるかどうかを確認します。
6 番目のグラフィックス カードで読み取りと書き込みにエラーがあることがわかります。これが発生した場合は、グラフィックス カードが壊れているはずです。1 つが欠けている場合は、1 つが欠けています。問題は解決されていません。解決後にアップデートしてください。