Ubuntu 20.04 RTX 4090 グラフィックス カードのディープ ラーニング環境構成 (Nvidia グラフィックス カード ドライバー、CUDA11.6.0、cuDNN8.5)
1. Nvidia グラフィックス カードを取り付けます
参考資料:ゼロから 1 までのナニーレベルの Ubuntu ディープ ラーニング サーバー環境構成チュートリアル。
文献の「3. NVIDIA ドライバーのインストール」を参照してください。
NVIDIA ドライバーをインストールします。これは、CUDA10.0 とそれに対応するバージョンの CuDNN および tensorflow をインストールするための重要なステップでもあります。
1.1 グラフィックス カードのモデルを入力して、グラフィックス カード ドライバーのサポートされているバージョンを確認します。
1.1.1 中国の Nvidia ドライバー公式 Web サイト
Nvidia China Driver の公式 Web サイトにアクセスします。
1.1.2 グラフィックス カード モデルのクエリを入力します
1.1.3 検索結果の表示
1.2 Nvidiaをダウンロードしてインストールします
1.2.1 方法 1
525 サーバー (プロプライエタリ) バージョンを Ubuntu システムのソフト アップデートに直接インストールします
。 注:
1.2.1 方法 2
以下の方法は使用しませんでしたので、ぜひ試してみてください。
参考:ubuntuにnvidiaドライバをインストールする(pro-testが有効、これは方法2)
参考:ubuntuにnvidiaドライバをインストールする(pro-testが有効、これは方法1))
2.CUDA11.6.0をインストールする
参考: nvidia_driver_510+cuda_11.6+cudnn_11.x を ubuntu18.04 にインストールする
参考:ゼロから 1 のナニーレベルまでの Ubuntu ディープラーニングサーバー環境構成チュートリアル
2.1 コンピューターの GPU が CUDA と互換性があるかどうかを確認します (N カードのサポート)
lspci | grep -i nvidia
互換性のあるものを表示する 互換性のあるもの
2.2 CUDA公式Webサイトに入る
CUDA 公式ウェブサイト: https://developer.nvidia.com/cuda-toolkit-archive
2.3 CUDA11.6.0をダウンロードしてインストールする
私は、同じフォルダー「ソフトウェア」にいくつかのファイルをダウンロードしてインストールすることに慣れています。
ステップ 1: ホームの下に新しいファイルを作成します。
cd # 返回home目录
mkdir software # 新建 software文件夹
ステップ 2: CUDA11.6.0 インストール パッケージをソフトウェア フォルダーにダウンロードする
wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run
3 番目のステップ (省略可能): 実行ファイルにアクセス許可を与える
sudo chmod 777 cuda_11.6.0_510.39.01_linux.run
ステップ 4: 実行ファイルを実行します (--override: ファイルをオーバーライドして置換することを意味します)
sudo sh cuda_11.6.0_510.39.01_linux.run --override
フォローアップを待っています:
(1) [続行] を選択します
(2) 入力: 受け入れます
(3)
[Enter] ボタンを選択し
て、以前にインストールされている Nvidia グラフィックス カード 525 を選択またはキャンセルします。ここではドライバーは必要ありません (最初の 2 つはキャンセルされます) (X はチェック済みを表します)
最後に、インストールし、完了を待ちます
2.4 CUDA11.6.0インストール後の設定
ステップ 1: 関連する環境変数を構成します。
(1) ~/.bashrc ファイルを開きます。コードは次のとおりです。
sudo vim ~/.bashrc
(2) ~/.bashrc の末尾に以下の内容を記述し、正常に保存します。
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${
LD_LIBRARY_PATH:+:${
LD_LIBRARY_PATH}}
(3) 保存して終了します。ターミナル実行
source ~/.bashrc
フォローはご希望に応じて行いますが、わかりません。
参考: ubuntu18.04 インストール nvidia_driver_510+cuda_11.6+cudnn_11.x
ステップ 2: vim コマンドを使用して /etc/profile ファイルを開き、CUDA 環境変数を追加します。コードは次のとおりです。
(1)
sudo vim /etc/profile
(2) 文書を開き、文書の最後に次の 2 つの文を追加します。
PATH=/usr/local/cuda/bin:$PATH
export PATH
(3) 保存後、次のコマンドを実行して環境変数をすぐに有効にします。コードは次のとおりです。
source /etc/profile
ステップ 3: lib ライブラリ パスを追加すると同時に、/etc/ld.so.conf.d/ に新しいファイル cuda.conf を作成します。コマンドは次のとおりです。
(1)
sudo vim /etc/ld.so.conf.d/cuda.conf
(2) 本文に以下を追加します。
/usr/local/cuda/lib64
(3) 次のコマンドを実行してすぐに有効にします。コードは次のとおりです。
sudo ldconfig
2.5 CUDA サンプルを使用して、CUDA のインストールが成功したかどうかをテストする
cd /usr/local/cuda-11.6/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
一般に、次の問題に直面します。
バージョン 11.6 cuda のインストール ディレクトリ /usr/local/cuda-11.6/samples には txt ファイルが 1 つだけあります。これは、おおよそ cuda の新しいバージョンを示すものであり、サンプルの内容は github からダウンロードする必要があります。
解決:
ステップ 1: テスト例をダウンロードする
(1) /usr/local/cuda-11.6/samples ディレクトリに移動します
cd /usr/local/cuda-11.6/samples/
(2)githubのダウンロード
git clone https://gitee.com/liwuhaoooo/cuda-samples.git
アクセス権限がない可能性が高いので、この時はcuda-11.6フォルダ配下のターミナルを開いてください。
su
输入密码切换超级用户
chmod 777 samples
git clone を再度実行してください。
ステップ 2: 1_Utilities/deviceQuery フォルダーを見つけます。
(1) deviceQueryフォルダに移動
(2) 実行
sudo make
./deviceQuery
(3) ショーパス
知らせ:
3. CUDA 11.x 用の cuDNN v8.5.0 (2022 年 8 月 8 日) をインストールします。
参考資料:ゼロからワンナニーレベルまでのUbuntuディープラーニングサーバー環境構成チュートリアル
3.1 公式サイトを開いてメールアドレスを登録します(私はqqメールアドレスを使用しています)
参考資料を参照してください (cuDNN の部分):ゼロから 1 の乳母レベルまでの Ubuntu 深層学習サーバー環境構成チュートリアル
3.2 cuDNN v8.5.0 (2022 年 8 月 8 日) をダウンロード (CUDA 11.x 用)
同様にダウンロード後、softwareフォルダに置きます。
3.3 CUDA 11.x 用の cuDNN v8.5.0 (2022 年 8 月 8 日) のインストール
ステップ 1: 公式のインストール方法を表示する
Nvidia 公式インストール チュートリアル: https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html
公式の操作に従ってください。これはおそらくドキュメント内の XY を CUDA バージョン番号 v8 に変更することを意味します。 xxx を cuDNN のバージョン番号に変更します。ここでは、XY を 11.5 に、v8.xxx を 8.3.2.44 に変更します。学生は変更を参照できます。
ステップ 2: インストール
(1) ダウンロードパスに切り替える
cd ~/software
(2) 解凍する
tar -xvf cudnn-linux-x86_64-8.5.0.96_cuda11-archive.tar.xz
(3) ファイルが正常に解凍されたら、それを無視して次のコマンドを直接実行します (変更なし、バージョン番号なし)。
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
3.4 インストールの確認
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2