CentOS8は、NVIDIAグラフィックスドライバー、CUDA、およびAnacondaをインストールします

CentOS8は、NVIDIAグラフィックスドライバー、CUDA、およびAnacondaをインストールします

参照:CentOS nvidia + cuda + cudnnのインストール

NVIDIAグラフィックスドライバーをインストールする

1. NVIDIA GPUがインストールされているかどうかを確認します(ハードウェアレベル)。

lspci | grep -i nvidia

ここに画像の説明を挿入

2. GCC、カーネルコンポーネント、dkmsなどをインストールします。

sudo yum install gcc
sudo yum install gcc-c++
sudo yum -y install kernel-devel
sudo yum -y install kernel-headers
sudo yum -y install epel-release
sudo yum -y install dkms

事故に備えてすべて設置されています。

centos8では、カーネルバージョンがkenel-develおよびkernel-headersと一致していることを確認するのが最善です。

システム内のすべてのカーネルバージョンを表示します。

rpm -qa|grep kernel

ここに画像の説明を挿入

Linuxリリースバージョンを表示

cat /etc/os-release

ここに画像の説明を挿入

Linuxシステムのバージョンを表示する

uname -a
# Linux skylake 4.18.0-240.15.1.el8_3.x86_64 #1 SMP Mon Mar 1 17:16:16 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux

カーネルコンポーネントに関する情報を表示する

yum info kernel-devel kernel-headers

ここに画像の説明を挿入

3.対応するグラフィックカードバージョンをダウンロードします

nvidiaの公式ウェブサイトからドライバーをダウンロードします。
https://www.nvidia.cn/Download/index.aspx?lang=cn
ここに画像の説明を挿入
は、接尾辞runが付いたファイルをダウンロードしますNVIDIA-Linux-x86_64-440.118.02.run

ここでは、このファイルをローカルに保存してから、ssh(vscode)を介してサーバーにアップロードすることを選択します。私はvscodeを使用し、指定されたフォルダーにドラッグして、しばらくしてからアップロードします。

4.実行権限を付与します

chmod a+x NVIDIA-Linux-x86_64-440.118.02.run

5.nouveauを無効にします

centos8ではデフォルトで無効になっているようです。変更していません。lsmod | grep nouveauコマンドを直接確認したところ、出力が見つかりませんでした。無効になっていない場合は、以下の手順で変更できます。

# 打开配置文件:
vim /usr/lib/modprobe.d/dist-blacklist.conf
# 加上或修改 两行
blacklist nouveau
options nouveau modeset=0
查看nouveau是否禁用, 如果没有输出代表成功
lsmod | grep nouveau 

6.ドライバーをインストールします

途中で、dkmsがポップアップして、インストールしたいというメッセージが表示される場合があります。はい/ yで終わり、警告は気にする必要がなく、後でインストールされます。

sudo ./NVIDIA-Linux-x86_64-440.118.02.run

または

sudo ./NVIDIA-Linux-x86_64-440.118.02.run --kernel-source-path=/usr/src/kernels/4.18.0-240.15.1.el8_3.x86_64

ここに画像の説明を挿入
上記が成功した場合は、以下を無視してください!

エラー:現在実行中のカーネルのカーネルソースツリーが見つかりません

ドライバのインストール時にエラーが報告されました。
ここに画像の説明を挿入
私の問題は解決されていません。参照用です:https//blog.csdn.net/chris_pei/article/details/79203033

私の解決策:
(1)最初に、カーネル、kenel-devel、およびkernel-headersのバージョンを調整します。参照:https//blog.csdn.net/KnYoboy/article/details/104147009

# 查看当前系统内核的版本
uname -r
# 查看所有内核组件的版本
rpm -qa|grep kernel  #---发现内核有有2个版本,默认的kernel版本和组件版本不匹配
# 删除不需要的内核
yum remove kernel-不需要的内核(上一步可查看)
# 查看默认的启动内核
grubby --default-kernel  # 发现已经是新内核了
# 重启
sudo reboot

上記の操作を行って再起動すると、再度以下のエラーが発生しました。

ここに画像の説明を挿入ここに画像の説明を挿入
インストールされたdkms(以前はインストールされていません)、問題は解決されました

sudo yum -y install dkms

7.グラフィックカードが正常にインストールされているかどうかを確認します。

グラフィックカード情報が印刷され、グラフィックカードドライバが正常にインストールされたことが証明されます。

nvidia-smi

ここに画像の説明を挿入


CUDAをインストールする

1.対応するCUDAバージョンをダウンロードします

公式ウェブサイト:https//developer.nvidia.com/zh-cn/cuda-downloads

公式ウェブサイトはデフォルトで最新バージョンであることに注意してください。以前のバージョンをダウンロードしたい場合は、ここで見つけてください。下の画像を参照してください。
ここに画像の説明を挿入

ここに画像の説明を挿入
サーバーのインターネット速度が悪い場合、またはパブリックネットワークに接続されていない場合は、サーバーをローカルに保存してからサーバーにアップロードします。

ここに画像の説明を挿入
コピーURLを開いた後、約数ギガバイトでダウンロードできます。

ダウンロードが完了したら、vscodeでサーバー上のフォルダーにドラッグします。アップロードが遅く、時間がかかります。

2.権限を取得します

chmod a+x cuda_10.2.89_440.33.01_linux.run 

3.CUDAをインストールします

sudo sh cuda_10.2.89_440.33.01_linux.run

契約を待った後、acceptそれを入力し、Enterキーを押して、インストールするコンテンツを選択できるようにします。ここにすでにドライバをインストールしているので、Enterキーを押してドライバ項目をキャンセルしても、他の項目は変更されません。下に移動して選択しinstall、Enterキーを押してインストールします。

その後update、現在インストールされているドライバーと一致する必要があることを通知し、Enterキーを押して更新を選択すると、完全にインストールされます。

問題がある場合は、以下の解決策をご覧ください。

インストール中にエラーが発生しました

ログを確認したところ、ドライバーが以前にインストールされていたためであり、再度インストールされたため、2つのバージョンのドライバー間で競合が発生したことがわかりました。

解決策:グラフィックカードドライバを事前にインストールして
ここに画像の説明を挿入
ここに画像の説明を挿入
ここに画像の説明を挿入
いる場合は、ここにドライバをインストールすることを選択しないでください。ドライバオプションをキャンセルするには、Enterキーを押す必要があることに注意してください。
ここに画像の説明を挿入
上記の情報が表示された場合は、CUDAのインストールプロセス中に問題がないことを意味します。

4.CUDAは環境変数としてエクスポートされます

編集のためにvimを開きます。

vi ~/.bashrc

次のコンテンツを追加します。

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

変更が完了したら、編集モードを終了し、保存して最終行モードで終了します。

:wq

現在のシェルで実行して、環境変数を有効にします。

source ~/.bashrc

5.インストールが成功したかどうかを確認します

nvcc -V
nvidia-smi

次のメッセージは成功を示します。ご覧のとおり、CUDA10.2をインストールしました。
ここに画像の説明を挿入
さらなる検証。

cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

ここに画像の説明を挿入
ここに画像の説明を挿入
ここに画像の説明を挿入
Result = PASSすべてのグラフィックカードが表示され、正常に検出されます。これは、グラフィックドライバとCUDAが正常にインストールされたことを意味します。


Anacondaをインストールします

参照:https//blog.csdn.net/qq_44486439/article/details/107744449

1.インストールファイルをダウンロードします

wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2020.02-Linux-x86_64.sh

2.Anacondaをインストールします

bash Anaconda3-2020.02-Linux-x86_64.sh

ずっと入力してから、はい。次の場所はより重要です。インストールパスを選択し、デフォルトのパスを選択してここに直接入力します~/anaconda3
ここに画像の説明を挿入
インストールに成功しました。
ここに画像の説明を挿入

3.コンダを環境変数としてエクスポートします

sudo vim /etc/profile

最後に追加:

export ANACONDA_PATH=~/anaconda3
export PATH=$PATH:$ANACONDA_PATH/bin

次に、強制的に保存して終了します。

:wq!

現在のシェルで実行して有効にします。

source /etc/profile

4.成功したかどうかを確認します

which anaconda
conda --version
conda info -e
python

ここに画像の説明を挿入


誰もが批判して訂正することを歓迎します!

おすすめ

転載: blog.csdn.net/weixin_41650348/article/details/115110021