起因
- nvidia-smi は nvcc --version バージョンと一貫性がありません。https:
//blog.csdn.net/weixin_39518984/article/details/111406728 を参照してください。 - 実験にはより高いバージョンの cuda が必要です
Tensorflow cuda cudnn バージョン対応リファレンス https://blog.csdn.net/weixin_45184581/article/details/124583991
古いcudaをアンインストールする
sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
/usr/local/cuda-9.0 フォルダーに移動して確認します。一般的に、いくつかの cudnn ファイルがあるので、それを削除します。
sudo rm -rf /usr/local/cuda-9.0
新しいcudaをインストールする
ダウンロードアドレス https://developer.nvidia.com/cuda-toolkit-archive
ダウンロードとインストールはそれぞれコマンドプロンプトに従って行います
インストール時:
ドライバーをインストールしないでください
環境変数を変更する
sudo gedit ~/.bashrc
元のコンテンツを次のように変更します
export PATH="/usr/local/cuda-11.2/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-11.2/lib64:$LD_LIBRARY_PATH"
保存して実行を終了する
source ~/.bashrc
cudaを検証する
cd /usr/local/cuda-11.6
chmod 777 samples
cd samples
git clone https://gitee.com/liwuhaoooo/cuda-samples.git
#或者git clone samples里面给的那个地址
ダウンロード後
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
インストール成功
cudnn をインストールする
ダウンロード アドレス https://developer.nvidia.com/zh-cn/cudnn
を最初に登録してログインする必要があります
。ダウンロード後、解凍して解凍したフォルダーに入ります。
sudo cp include/cudnn.h /usr/local/cuda-11.6/include
sudo cp lib/libcudnn* /usr/local/cuda-11.6/lib64
sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h
sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*