Ubuntu 20.04 RTX 4090 グラフィックス カードのディープ ラーニング環境構成 (Nvidia グラフィックス カード ドライバー、CUDA11.6.0、cuDNN8.5)

Ubuntu 20.04 RTX 4090 グラフィックス カードのディープ ラーニング環境構成 (Nvidia グラフィックス カード ドライバー、CUDA11.6.0、cuDNN8.5)


1. Nvidia グラフィックス カードを取り付けます

参考資料:ゼロから 1 までのナニーレベルの Ubuntu ディープ ラーニング サーバー環境構成チュートリアル。
文献の「3. NVIDIA ドライバーのインストール」を参照してください。

NVIDIA ドライバーをインストールします。これは、CUDA10.0 とそれに対応するバージョンの CuDNN および tensorflow をインストールするための重要なステップでもあります。

1.1 グラフィックス カードのモデルを入力して、グラフィックス カード ドライバーのサポートされているバージョンを確認します。

1.1.1 中国の Nvidia ドライバー公式 Web サイト

Nvidia China Driver の公式 Web サイトにアクセスします。
ここに画像の説明を挿入

1.1.2 グラフィックス カード モデルのクエリを入力します

ここに画像の説明を挿入

1.1.3 検索結果の表示

ここに画像の説明を挿入

1.2 Nvidiaをダウンロードしてインストールします

1.2.1 方法 1

525 サーバー (プロプライエタリ) バージョンを Ubuntu システムのソフト アップデートに直接インストールします
ここに画像の説明を挿入
。 注:
ここに画像の説明を挿入

1.2.1 方法 2

以下の方法は使用しませんでしたので、ぜひ試してみてください。
参考:ubuntuにnv​​idiaドライバをインストールする(pro-testが有効、これは方法2)
参考:ubuntuにnv​​idiaドライバをインストールする(pro-testが有効、これは方法1))

2.CUDA11.6.0をインストールする

参考: nvidia_driver_510+cuda_11.6+cudnn_11.x を ubuntu18.04 にインストールする
参考:ゼロから 1 のナニーレベルまでの Ubuntu ディープラーニングサーバー環境構成チュートリアル

2.1 コンピューターの GPU が CUDA と互換性があるかどうかを確認します (N カードのサポート)

lspci | grep -i nvidia

互換性のあるものを表示する 互換性のあるもの
ここに画像の説明を挿入

2.2 CUDA公式Webサイトに入る

CUDA 公式ウェブサイト: https://developer.nvidia.com/cuda-toolkit-archive
ここに画像の説明を挿入
ここに画像の説明を挿入

2.3 CUDA11.6.0をダウンロードしてインストールする

私は、同じフォルダー「ソフトウェア」にいくつかのファイルをダウンロードしてインストールすることに慣れています。
ステップ 1: ホームの下に新しいファイルを作成します。

cd # 返回home目录
mkdir software # 新建 software文件夹

ステップ 2: CUDA11.6.0 インストール パッケージをソフトウェア フォルダーにダウンロードする

wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run

3 番目のステップ (省略可能): 実行ファイルにアクセス許可を与える

sudo chmod 777 cuda_11.6.0_510.39.01_linux.run 

ステップ 4: 実行ファイルを実行します (--override: ファイルをオーバーライドして置換することを意味します)

sudo sh cuda_11.6.0_510.39.01_linux.run --override

フォローアップを待っています:
(1) [続行] を選択します
ここに画像の説明を挿入
(2) 入力: 受け入れます
ここに画像の説明を挿入
(3)
[Enter] ボタンを選択し
て、以前にインストールされている Nvidia グラフィックス カード 525 を選択またはキャンセルします。ここではドライバーは必要ありません (最初の 2 つはキャンセルされます) (X はチェック済みを表します)
最後に、インストールし、完了を待ちます
ここに画像の説明を挿入

2.4 CUDA11.6.0インストール後の設定

ステップ 1: 関連する環境変数を構成します。

(1) ~/.bashrc ファイルを開きます。コードは次のとおりです。

sudo vim ~/.bashrc

(2) ~/.bashrc の末尾に以下の内容を記述し、正常に保存します。

export CUDA_HOME=/usr/local/cuda 
export PATH=$PATH:$CUDA_HOME/bin 
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${
    
    LD_LIBRARY_PATH:+:${
    
    LD_LIBRARY_PATH}}

(3) 保存して終了します。ターミナル実行

source ~/.bashrc

フォローはご希望に応じて行いますが、わかりません。
参考: ubuntu18.04 インストール nvidia_driver_510+cuda_11.6+cudnn_11.x

ステップ 2: vim コマンドを使用して /etc/profile ファイルを開き、CUDA 環境変数を追加します。コードは次のとおりです。

(1)

sudo vim /etc/profile

(2) 文書を開き、文書の最後に次の 2 つの文を追加します。

PATH=/usr/local/cuda/bin:$PATH  
export PATH

(3) 保存後、次のコマンドを実行して環境変数をすぐに有効にします。コードは次のとおりです。

source /etc/profile

ステップ 3: lib ライブラリ パスを追加すると同時に、/etc/ld.so.conf.d/ に新しいファイル cuda.conf を作成します。コマンドは次のとおりです。

(1)

sudo vim /etc/ld.so.conf.d/cuda.conf

(2) 本文に以下を追加します。

/usr/local/cuda/lib64

(3) 次のコマンドを実行してすぐに有効にします。コードは次のとおりです。

sudo ldconfig

2.5 CUDA サンプルを使用して、CUDA のインストールが成功したかどうかをテストする

cd /usr/local/cuda-11.6/samples/1_Utilities/deviceQuery 
sudo make
./deviceQuery

一般に、次の問題に直面します。

バージョン 11.6 cuda のインストール ディレクトリ /usr/local/cuda-11.6/samples には txt ファイルが 1 つだけあります。これは、おおよそ cuda の新しいバージョンを示すものであり、サンプルの内容は github からダウンロードする必要があります。

解決:

ステップ 1: テスト例をダウンロードする

(1) /usr/local/cuda-11.6/samples ディレクトリに移動します

cd /usr/local/cuda-11.6/samples/

(2)githubのダウンロード

git clone https://gitee.com/liwuhaoooo/cuda-samples.git

アクセス権限がない可能性が高いので、この時はcuda-11.6フォルダ配下のターミナルを開いてください。

su
输入密码切换超级用户
chmod 777 samples

git clone を再度実行してください。

ステップ 2: 1_Utilities/deviceQuery フォルダーを見つけます。

(1) deviceQueryフォルダに移動
ここに画像の説明を挿入
(2) 実行

sudo make
./deviceQuery

(3) ショーパス
ここに画像の説明を挿入

知らせ:
ここに画像の説明を挿入

3. CUDA 11.x 用の cuDNN v8.5.0 (2022 年 8 月 8 日) をインストールします。

参考資料:ゼロからワンナニーレベルまでのUbuntuディープラーニングサーバー環境構成チュートリアル

3.1 公式サイトを開いてメールアドレスを登録します(私はqqメールアドレスを使用しています)

参考資料を参照してください (cuDNN の部分):ゼロから 1 の乳母レベルまでの Ubuntu 深層学習サーバー環境構成チュートリアル

3.2 cuDNN v8.5.0 (2022 年 8 月 8 日) をダウンロード (CUDA 11.x 用)

ここに画像の説明を挿入
同様にダウンロード後、softwareフォルダに置きます。

3.3 CUDA 11.x 用の cuDNN v8.5.0 (2022 年 8 月 8 日) のインストール

参考:Ubuntu20.04でNvidiaグラフィックカードドライバー、CUDA11.5、cuDNN8.3、Anaconda、Tensorflowをインストール - GPU版詳細グラフィック操作チュートリアル

ステップ 1: 公式のインストール方法を表示する

Nvidia 公式インストール チュートリアル: https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html
ここに画像の説明を挿入
公式の操作に従ってください。これはおそらくドキュメント内の XY を CUDA バージョン番号 v8 に変更することを意味します。 xxx を cuDNN のバージョン番号に変更します。ここでは、XY を 11.5 に、v8.xxx を 8.3.2.44 に変更します。学生は変更を参照できます。

ステップ 2: インストール

(1) ダウンロードパスに切り替える

cd ~/software

(2) 解凍する

tar -xvf cudnn-linux-x86_64-8.5.0.96_cuda11-archive.tar.xz

(3) ファイルが正常に解凍されたら、それを無視して次のコマンドを直接実行します (変更なし、バージョン番号なし)。

sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include 
sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64 
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

3.4 インストールの確認

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

ここに画像の説明を挿入

おすすめ

転載: blog.csdn.net/chen20170325/article/details/130294270