ubuntu16.04.6配置cuda及cudnn
一.查看显卡信息
在终端输入命令lspci -vnn | grep VGA -A 12
查看显卡信息,输出如下图所示:
二.安装CUDA
(1)下载cuda包
首先我想在服务器上安装tensorflow-gpu==1.13.2,查了一下对应表格放上来,由表中知道需要的CUDA版本是10.0。
去 英伟达的官方网站 找到该页面如图所示:
进入到如下页面:根据自己的系统选择相应的CUDA版本,我自己的系统是ubuntu16.04,如图所示下载cuda的安装包。
(2)安装cuda
下载好安装包之后,将安装包拷贝到服务器的某个目录下,在安装包所在的目录下执行
sudo sh cuda_10.0.130_410.48_linux.run
如果你是其他版本的版本替换一下即可。
运行上述命令之后会出现如图所示的提示:
按enter键一行一行阅读,按ctrl+c直接跳到最后:
根据提示如红框所示输入accept,点击回车进行安装。
等待安装的第一步出现是否安装nvidia driver 选择no
接下来所有的步骤都选择yes,然后按enter一路安装,显示安装完成后输入nvcc -V
查看安装的cuda版本。
如果提示:
不要慌,切换到/usr/local/
目录下查看是否有cuda目录,如果有的话只需要添加环境变量就可以了,执行vim ~/.bashrc
,在文件中添加export PATH=$PATH:/usr/local/cuda/bin export LD_LIBRARY_PATH=/usr/local/cuda/bin/lib64:$LD_LIBRARY_PATH
保存退出。如图所示:
添加好后,执行source ~/.bashrc
完成配置,再次执行nvcc -V
,会看到cuda的安装版本信息:
三.安装CUDNN
(1) 下载cudnn安装包
进入cudnn下载的官方网站,如图所示
根据tensorflow对应cuda版本及cudnn版本信息,我们选择对应的cudnn版本安装包进行下载。
(2) 安装cudnn
将下载好的3个安装包,拷贝到服务器的相应目录,执行以下3个命令:(根据自己的版本替换)
sudo dpkg -i libcudnn7_7.6.5.32-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-dev_7.6.5.32-1+cuda10.0_amd64.deb
sudo dpkg -i libcudnn7-doc_7.6.5.32-1+cuda10.0_amd64.deb
四.安装nvidia驱动
(1)下载对应的驱动版本
找到英伟达的驱动官网,如图所示
根据我们的显卡信息选择搜索,结果如图:
下载驱动程序,将下载好的驱动程序拷贝到服务器对应的目录,进行安装。
(2)安装驱动
1.查看自带驱动状态
安装之前先要查看ubuntu自带的驱动是否是运行状态lsmod | grep nouveau
如果有输出如图,需要我们手动禁用nouveau
2.修改配置文件
执行sudo vim /etc/modprobe.d/blacklist.conf
打开文件在文件的最后插入
blacklist nouveau
options nouveau modeset=0
如图所示保存退出
执行以下命令生效
sudo update-initramfs -u
3.重启机器
sudo reboot
等到服务器重新启动之后,再重新连接。
4.再次查看自带驱动状态
lsmod | grep nouveau
看到无任何输出之后,我们进行下一步的nvidia驱动安装。
5.安装nvidia驱动
按顺序执行如下命令
sudo chmod a+x NVIDIA-Linux-x86_64-440.64.run
sudo ./NVIDIA-Linux-x86_64-440.64.run
一路ok + enter完成安装。
6.输入nvidia-smi查看gpu信息
至此完成所有配置及安装,大功告成!