準備ができて
CUDAバージョン:10.0
インストールパッケージ
- cuda_10.0.130_410.48_linux.run
- cudnn-10.0-linux-x64-v7.5.0.56.tgz
ハードウェア環境を確認する
- システムにGPUがインストールされているかどうかを確認し、次のコマンドを実行します。
lspci | grep -i nvidia
输出类似如下信息表明已安装 GPU :
03:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)
03:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)
- カーネルのバージョンを確認する
uname -r
# 如果内核版本小于3.10.0-957,则升级至3.10.0-957:
yum install kernel
- 手動でブートカーネルを設定します。
grub2-set-default "CentOS Linux (3.10.0-957.1.3.el7.x86_64) 7 (Core)"
システムを再起動して、変更が有効かどうかを確認します。
ソフトウェア環境を確認する
- カーネルヘッダーファイルをインストールする
yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
- GCC、EPELソース、DKMSをインストールする
yum install gcc gcc-c++
yum install epel-release
yum install --enablerepo=epel dkms
- Nouveauドライバーを無効にする
vi /etc/modprobe.d/blacklist-nouveau.conf
# 编辑内容
blacklist nouveau
options nouveau modeset=0
保存文件执行
dracut --force
# 运行以下命令查看是否禁用成功
lsmod | grep nouveau
# 如果有输出如下信息,说明禁用失败,可以尝试重启之后,再执行lsmod | grep nouveau。
インストールする
- テキストモードに入る
init 3
- インストールスクリプトを実行する
# sh cuda_10.0.130_410.48_linux.run
Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 387.26?
(y)es/(n)o/(q)uit: y
Do you want to install the OpenGL libraries?
(y)es/(n)o/(q)uit [ default is yes ]: n
Do you want to run nvidia-xconfig?
(y)es/(n)o/(q)uit [ default is no ]: n
Install the CUDA 10.0 Toolkit?
(y)es/(n)o/(q)uit: y
Enter Toolkit Location
[ default is /usr/local/cuda-10.0 ]: /home/default
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y
Install the CUDA 10.0 Samples?
(y)es/(n)o/(q)uit: n
===========
= Summary =
===========
Driver: Installed
Toolkit: Installed
Samples: Not Selected
- インストールが成功したかどうかを確認します
# 命令查看 GPU 设备状态,出现一下内容说明安装成功
nvidia-smi
- テストプログラムを実行して、CUDA ToolKitが正常にインストールされているかどうかを確認します。
$ /usr/local/cuda/extras/demo_Suite/deviceQuery
/usr/local/cuda/extras/demo_suite/deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
Detected 1 CUDA Capable device(s)
Device 0: "GeForce GTX 1080 Ti"
CUDA Driver Version / Runtime Version 10.0 / 10.0
CUDA Capability Major/Minor version number: 6.1
Total amount of global memory: 11178 MBytes (11721506816 bytes)
(28) Multiprocessors, (128) CUDA Cores/MP: 3584 CUDA Cores
GPU Max Clock rate: 1582 MHz (1.58 GHz)
Memory Clock rate: 5505 Mhz
......
......
......
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.0, CUDA Runtime Version = 10.0, NumDevs = 1, Device0 = GeForce GTX 1080 Ti
Result = PASS
- cuDNNライブラリをインストールする
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
アンインストール
CUDAを更新する必要がある場合、またはCUDAをアクティブにアンインストールする必要がある場合は、以下のアンインストール方法に従ってください。
最初にCUDA ToolKitをアンインストールしてから、NVIDIAドライバーをアンインストールします。
/icooper/tools/cuda-10.0/bin/uninstall_cuda_10.0.pl
# 卸载 dmks 中的 nvidia 模块
dkms remove nvidia/396.26 -k 3.10.0-957.1.3.el7.x86_64
nvidia-uninstall
参考資料
Nvidia CUDAインストールドキュメント:https :
//docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#runfile-installation
Nvidia cuDNNインストールドキュメント:https ://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html