CentOS8は、NVIDIAグラフィックスドライバー、CUDA、およびAnacondaをインストールします
参照:CentOS nvidia + cuda + cudnnのインストール
NVIDIAグラフィックスドライバーをインストールする
1. NVIDIA GPUがインストールされているかどうかを確認します(ハードウェアレベル)。
lspci | grep -i nvidia
2. GCC、カーネルコンポーネント、dkmsなどをインストールします。
sudo yum install gcc
sudo yum install gcc-c++
sudo yum -y install kernel-devel
sudo yum -y install kernel-headers
sudo yum -y install epel-release
sudo yum -y install dkms
事故に備えてすべて設置されています。。
centos8では、カーネルバージョンがkenel-develおよびkernel-headersと一致していることを確認するのが最善です。
システム内のすべてのカーネルバージョンを表示します。
rpm -qa|grep kernel
Linuxリリースバージョンを表示
cat /etc/os-release
Linuxシステムのバージョンを表示する
uname -a
# Linux skylake 4.18.0-240.15.1.el8_3.x86_64 #1 SMP Mon Mar 1 17:16:16 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux
カーネルコンポーネントに関する情報を表示する
yum info kernel-devel kernel-headers
3.対応するグラフィックカードバージョンをダウンロードします
nvidiaの公式ウェブサイトからドライバーをダウンロードします。
https://www.nvidia.cn/Download/index.aspx?lang=cn
は、接尾辞runが付いたファイルをダウンロードしますNVIDIA-Linux-x86_64-440.118.02.run
。
ここでは、このファイルをローカルに保存してから、ssh(vscode)を介してサーバーにアップロードすることを選択します。私はvscodeを使用し、指定されたフォルダーにドラッグして、しばらくしてからアップロードします。
4.実行権限を付与します
chmod a+x NVIDIA-Linux-x86_64-440.118.02.run
5.nouveauを無効にします
centos8ではデフォルトで無効になっているようです。変更していません。lsmod | grep nouveau
コマンドを直接確認したところ、出力が見つかりませんでした。無効になっていない場合は、以下の手順で変更できます。
# 打开配置文件:
vim /usr/lib/modprobe.d/dist-blacklist.conf
# 加上或修改 两行
blacklist nouveau
options nouveau modeset=0
查看nouveau是否禁用, 如果没有输出代表成功
lsmod | grep nouveau
6.ドライバーをインストールします
途中で、dkmsがポップアップして、インストールしたいというメッセージが表示される場合があります。はい/ yで終わり、警告は気にする必要がなく、後でインストールされます。
sudo ./NVIDIA-Linux-x86_64-440.118.02.run
または
sudo ./NVIDIA-Linux-x86_64-440.118.02.run --kernel-source-path=/usr/src/kernels/4.18.0-240.15.1.el8_3.x86_64
上記が成功した場合は、以下を無視してください!
エラー:現在実行中のカーネルのカーネルソースツリーが見つかりません
ドライバのインストール時にエラーが報告されました。
私の問題は解決されていません。参照用です:https://blog.csdn.net/chris_pei/article/details/79203033
私の解決策:
(1)最初に、カーネル、kenel-devel、およびkernel-headersのバージョンを調整します。参照:https://blog.csdn.net/KnYoboy/article/details/104147009
# 查看当前系统内核的版本
uname -r
# 查看所有内核组件的版本
rpm -qa|grep kernel #---发现内核有有2个版本,默认的kernel版本和组件版本不匹配
# 删除不需要的内核
yum remove kernel-不需要的内核(上一步可查看)
# 查看默认的启动内核
grubby --default-kernel # 发现已经是新内核了
# 重启
sudo reboot
上記の操作を行って再起動すると、再度以下のエラーが発生しました。。
インストールされたdkms(以前はインストールされていません)、問題は解決されました
sudo yum -y install dkms
7.グラフィックカードが正常にインストールされているかどうかを確認します。
グラフィックカード情報が印刷され、グラフィックカードドライバが正常にインストールされたことが証明されます。
nvidia-smi
CUDAをインストールする
1.対応するCUDAバージョンをダウンロードします
公式ウェブサイト:https://developer.nvidia.com/zh-cn/cuda-downloads
公式ウェブサイトはデフォルトで最新バージョンであることに注意してください。以前のバージョンをダウンロードしたい場合は、ここで見つけてください。下の画像を参照してください。
サーバーのインターネット速度が悪い場合、またはパブリックネットワークに接続されていない場合は、サーバーをローカルに保存してからサーバーにアップロードします。
コピーURLを開いた後、約数ギガバイトでダウンロードできます。
ダウンロードが完了したら、vscodeでサーバー上のフォルダーにドラッグします。アップロードが遅く、時間がかかります。
2.権限を取得します
chmod a+x cuda_10.2.89_440.33.01_linux.run
3.CUDAをインストールします
sudo sh cuda_10.2.89_440.33.01_linux.run
契約を待った後、accept
それを入力し、Enterキーを押して、インストールするコンテンツを選択できるようにします。ここにすでにドライバをインストールしているので、Enterキーを押してドライバ項目をキャンセルしても、他の項目は変更されません。下に移動して選択しinstall
、Enterキーを押してインストールします。
その後update
、現在インストールされているドライバーと一致する必要があることを通知し、Enterキーを押して更新を選択すると、完全にインストールされます。
問題がある場合は、以下の解決策をご覧ください。
インストール中にエラーが発生しました
ログを確認したところ、ドライバーが以前にインストールされていたためであり、再度インストールされたため、2つのバージョンのドライバー間で競合が発生したことがわかりました。
解決策:グラフィックカードドライバを事前にインストールして
いる場合は、ここにドライバをインストールすることを選択しないでください。ドライバオプションをキャンセルするには、Enterキーを押す必要があることに注意してください。
上記の情報が表示された場合は、CUDAのインストールプロセス中に問題がないことを意味します。
4.CUDAは環境変数としてエクスポートされます
編集のためにvimを開きます。
vi ~/.bashrc
次のコンテンツを追加します。
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
変更が完了したら、編集モードを終了し、保存して最終行モードで終了します。
:wq
現在のシェルで実行して、環境変数を有効にします。
source ~/.bashrc
5.インストールが成功したかどうかを確認します
nvcc -V
nvidia-smi
次のメッセージは成功を示します。ご覧のとおり、CUDA10.2をインストールしました。
さらなる検証。
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
Result = PASS
すべてのグラフィックカードが表示され、正常に検出されます。これは、グラフィックドライバとCUDAが正常にインストールされたことを意味します。
Anacondaをインストールします
参照:https://blog.csdn.net/qq_44486439/article/details/107744449
1.インストールファイルをダウンロードします
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2020.02-Linux-x86_64.sh
2.Anacondaをインストールします
bash Anaconda3-2020.02-Linux-x86_64.sh
ずっと入力してから、はい。次の場所はより重要です。インストールパスを選択し、デフォルトのパスを選択してここに直接入力します~/anaconda3
。
インストールに成功しました。
3.コンダを環境変数としてエクスポートします
sudo vim /etc/profile
最後に追加:
export ANACONDA_PATH=~/anaconda3
export PATH=$PATH:$ANACONDA_PATH/bin
次に、強制的に保存して終了します。
:wq!
現在のシェルで実行して有効にします。
source /etc/profile
4.成功したかどうかを確認します
which anaconda
conda --version
conda info -e
python
誰もが批判して訂正することを歓迎します!