nvcc -V および nvidia-smi を使用して cuda バージョンを表示すると不一致が発生します。
nvcc -Vのバージョンは10.1です
nvidia-smiのバージョンは12.2です
上にバージョンが表示されている場合は、ドライバーがすでに存在することを意味します。まず、以前のドライバーを削除します。
1. 以下のコマンドを実行して古いバージョンのドライバーを削除します。
sudo apt-get purge nvidia*
この時点で、nvidia-smi を実行すると、「コマンド 'nvidia-smi' が見つかりません」というプロンプトが表示されるので、プロンプトに従ってインストールします。
sudo apt install nvidia-utils-535-server
インストール成功後、再度nvidia-smiを実行すると成功し、cudaのバージョンが12.2と表示されます。
2. 対応するバージョンの cuda をダウンロードします。
CUDA ツールキット 12.2 ダウンロード | NVIDIA 開発者
対応するオプションを選択するだけです。
ダウンロード リンクを取得します。
wget https://developer.download.nvidia.com/compute/cuda/12.2.0/local_installers/cuda_12.2.0_535.54.03_linux.run
sudo sh cuda_12.2.0_535.54.03_linux.run
cuda のダウンロードが成功したインターフェイスは次のとおりです。
3. インストール
元のコマンドを実行してインストールするとエラーが報告されますが、次のコマンドに変更するとインストールが成功します。
sudo sh ./cuda_12.2.0_535.54.03_linux.run --toolkit --silent --override
上記のコマンドは正常にインストールされました
この時点でもう一度実行すると、nvcc -V プロンプト、コマンド 'nvcc' が見つかりません...、プロンプトに従って nvidia-cuda-toolkit をインストールしないでください。そうしないと、前の手順が無駄になります。環境変数を設定するだけで済みます。
4. 環境変数を追加する
vim ~/.bashrc を実行し、ファイルを開きます。
以下を追加します (独自のディレクトリに従ってここを変更します)。
export LD_LIBRARY_PATH=/usr/local/cuda-12.2/lib64
export PATH=$PATH:/usr/local/cuda-12.2/bin
実行:source ~/.bashrc、即時有効
再度実行: nvcc -V、成功しました
これで終わりだ。
この記事への参照:
CUDA はインストールされていますが、nvcc -V でコマンドが見つからないと表示されます (Ubuntu20.04LTS システム)