Ubuntu は深層学習環境 (TensorFlow と pyTorch) を構成します


前書き: TensorFlow に対応する CUDA のバージョンをここで確認し、必要なバージョンに従ってインストールするのが最善ですが、11.6 を必要とする他のプログラムがあるため、この要件に従ってインストールしませんでした。
ここに画像の説明を挿入します

1.CUDAのインストール

1.1 グラフィックスカードドライバーをインストールする

推奨されるグラフィックス カードを表示する

ubuntu-drivers devices

ここに画像の説明を挿入します

推奨されるグラフィックス カードのバージョンをインストールします。ここでの推奨バージョンはバージョン 535 です。

sudo apt-get install nvidia-driver-535

バージョンを選択する必要があります。選択しないと、カーネルが自動的に更新されます。ただし、535をインストールすると画面が真っ暗になるため、510しかインストールできません。新しくインストールしたシステムなので、カーネルをアップデートしてもあまり影響はありません。また、インストールされているバージョンが低すぎると動作しません。以下の CUDA をインストールするには最小バージョンが必要であるためです。

1.2 CUDAのインストール

手動インストール方法を使用します。

nvidia-smi

グラフィックス カード ドライバーでサポートされている最も高い CUDA バージョンが 12.1 であることを確認します。cuda-toolkit-archiveに移動し、以下に示すように、ダウンロードに必要な CUDA バージョンを選択し、 runfile (local) を選択し、生成された手順を使用してダウンロードしてインストールします。
ここに画像の説明を挿入します
ここに画像の説明を挿入します
ここに画像の説明を挿入します
ここに画像の説明を挿入します

Enter キーを押してグラフィックス カード ドライバーのインストールをキャンセルし、最終的なインストールを選択します。
ここに画像の説明を挿入します
ここに画像の説明を挿入します

インストールが成功したら、環境を構成し、.bashrc ファイルの末尾に環境変数を追加します。

sudo gedit ~/.bashrc
# 添加以下内容:
export PATH=/usr/local/cuda-11.6/bin${
    
    PATH:+:${
    
    PATH}} 
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

または、ターミナルに次のコマンドを入力して追加します。

# Taken from: https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#post-installation-actions
echo 'export PATH=/usr/local/cuda-11.6/bin${PATH:+:${PATH}}' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' >> ~/.bashrc

インストールが成功したことを確認する

nvcc -V

ここに画像の説明を挿入します

1.3 cuDNNのインストール

CUDA のインストールが成功したら、CUDA の cuDNN 対応バージョンを公式 Web サイトからダウンロードし、cudnn-archiveに移動します (アカウントの登録が必要です)。ここでは、cuDNN の 8.9.4 バージョン (Linux x86_64 (Tar) のローカル インストーラー) を選択しました。 )、これは CUDA の 11.x バージョンに対応します。
ここに画像の説明を挿入します
ダウンロードが完了したら、ファイルが存在するディレクトリで解凍し、ダウンロードしたファイルの名前に注意してください。

tar -xvf cudnn-linux-x86_64-8.9.4.25_cuda11-archive.tar.xz

解凍が完了したら、いくつかのファイルをコピーして /usr/local に転送します (注: ダウンロードしたファイルの名前は自分で作成します。cudnn8.0 以降では、バージョン情報が cudnn_version.h ファイルに更新されます。このファイルもコピーする必要があります)そうでない場合、検証時に応答がありません):

cd cudnn-linux-x86_64-8.9.4.25_cuda11-archive
sudo cp include/cudnn.h /usr/local/cuda/include/ 
sudo cp lib/libcudnn* /usr/local/cuda/lib64/ 
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
sudo cp include/cudnn_version.h /usr/local/cuda/include/
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2  #验证

2.Anacondaのインストール

Anaconda の公式 Web サイトにアクセスし、「ダウンロード」をクリックします (Anaconda は、Web ページへのアクセスに使用されたシステムに応じて、対応するバージョンをダウンロードします。たとえば、ここでは Anaconda3-2023.03-Linux-x86_64.sh をダウンロードしました)

ここに画像の説明を挿入します
アナコンダをインストールする

bash Anaconda3-2023.03-Linux-x86_64.sh

(1) インストール同意書を表示し、 が表示されるまで Enter キーを押しDo you accept the license terms? [yes|no]yesインストールを続行するには Enter キーを押します。
(2) 「yes」と入力した後、インストール場所を確認するプロンプトが表示されます。ここをクリックしますEnter。デフォルトで十分です。
(3) Anaconda を初期化します。 、この手順では、プロンプトに従うだけで済みます。「yes」と入力するだけです。

ここに画像の説明を挿入します
ここに画像の説明を挿入します
ターミナルを再起動して conda 基本環境に入ります。この環境で Python の場所とバージョンを確認できます:
ここに画像の説明を挿入します
ターミナルの起動時に conda 基本環境をアクティブ化しないようにするには、auto_activate_baseパラメーターを false に設定します。

conda config --set auto_activate_base false

後で conda の基本環境に入りたい場合は、conda コマンドを使用してアクティブ化するだけです。

conda activate base

ここに画像の説明を挿入します

一般的に使用される conda コマンド:

  • conda環境を作成する
conda create --name 环境名 包名(多个包名用空格分隔)
# 例如:conda create --name my_env python=3.7 numpy pandas scipy
  • conda 環境をアクティブ化 (切り替え) します。
conda activate 环境名
# 例如:conda activate bas
  • 作成したconda環境を表示する
conda info --envs
# 或者:conda info -e,亦或者conda env list
  • 指定したconda環境を削除し、
# 通过环境名删除
conda remove --name 要删除的环境名 --all

# 通过指定环境文件位置删除(这个方法可以删除不同位置的同名环境)
conda remove -p 要删除的环境所在位置 --all
# 例如:conda remove -p /home/zard/anaconda3/envs/MaskRCNN --all

3. TensorFlow と pyTorch をインストールする

3.1 pyTorchのインストール

pyTorch 公式 Web サイト ( https://pytorch.org/ ) に入り、下にスクロールして、インストール コマンドを生成する環境を選択します。 インストール
ここに画像の説明を挿入します
コマンドをコピーします (私は 11.6 に変更しました)。

conda install pytorch torchvision torchaudio pytorch-cuda=11.6 -c pytorch -c nvidia

ここに画像の説明を挿入します
y を入力してインストールします (科学的にインターネットにアクセスする必要がある場合があります):
ここに画像の説明を挿入します
使用できるかどうかをテストします。

ipython

import torch
torch.cuda.is_availbale()

3.2 TensorFlow2 のインストール

# 创建一个虚拟环境
conda create -n tensorflow-gpu python=3.7
# 激活环境
conda activate tensorflow-gpu

pip install ipython
pip install tensorflow -U

ここに画像の説明を挿入します

tensorflow-gpu をインストールしないように注意してください。以下のエラーが報告されます。プロンプト メッセージによると、tensorflow のインストール時に GPU も使用できます。
どちらの方法でも、TensorFlow インストールで GPU アクセラレーションを使用できるようになります (実際、TensorFlow 2.1 の時点では、両方のパッケージは機能的に同一です)。具体的には次のとおりです。

  • TensorFlow をインストールするpip install --upgrade tensorflow場合 これは、TensorFlow が CPU と GPU の両方で実行できる汎用フレームワークであるためですが、GPU を活用するには正しい構成と依存関係が必要です。
  • を使用して TensorFlow-GPU バージョンをインストールするとpip install --upgrade tensorflow-gpu、GPU アクセラレーションを活用するようにすでに特別に構成されており、追加の構成は必要ありません。

どの方法が選択されるかに関係なく、GPU ドライバー、CUDA ツールキット、および cuDNN ライブラリの要件が満たされている限り、TensorFlow はアクセラレーションのために GPU を適切に使用できるはずです。
ここに画像の説明を挿入します
利用可能な GPU の数を確認することで、GPU アクセラレーションが有効であることを確認できます。

import tensorflow as tf
tf.test.is_gpu_available()
print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))

ここに画像の説明を挿入します

4.pyCharmをインストールする

4.1 pyCharmのインストール

公式 Web サイト ( https://www.jetbrains.com.cn/en-us/pycharm/ ) にアクセスして pycharm をダウンロードし
ここに画像の説明を挿入します
、「ダウンロード」をクリックして下にスクロールし、コミュニティ バージョンをダウンロードします。
ここに画像の説明を挿入します
ダウンロードが完了したら、解凍して次のように入力します。 bin ディレクトリに移動し、.sh ファイルを実行します。

cd pycharm-community-2023.2.1/bin/
sh pycharm.sh

ここに画像の説明を挿入します
ここに画像の説明を挿入します
インターフェイスが起動したら、開いた Pycharm ソフトウェア インターフェイスの左下隅にある設定アイコンをクリックし、[デスクトップ エントリの作成] を選択します。Pycharm を閉じ、左下隅をクリックしてアプリケーションを表示し、Pycharm を見つけて使用を開始します。クリックして
プラグインを入力し、マーケットプレイスを選択し、中国語を検索して、中国語の言語パックを見つけます (アイコンに「汉」の文字があります) ) を使用してインストールし、インストール後に pycharm を再起動します。

ここに画像の説明を挿入します

4.2 anaconda に関連付けられた Python インタープリター

新しいプロジェクトを作成した後、設定を開き、Python インタープリターを選択します。Python インタープリターを
ここに画像の説明を挿入します
追加し、Conda 環境を選択し、前に作成した仮想環境を選択します。
ここに画像の説明を挿入します
インストールしたライブラリがすでに存在していることがわかります。
ここに画像の説明を挿入します
ここに画像の説明を挿入します

おすすめ

転載: blog.csdn.net/zardforever123/article/details/133432077