ubuntu16.04安装显卡驱动和配置深度学习环境

前言

这几天一直在搭建ubuntu16.04下的深度学习环境,遇到许多坑,我将网上不同教程的优点总结了一下,在这里与大家分享。我使用的显卡是RTX2080,CUDA 9.0和CUDNN7_7.4.1.5。CUDA版本需要与CUDNN相适应,具体对应版本在官网下载时能看到。

安装显卡驱动

先到英伟达官网上下载与你的显卡对应的显卡驱动。下载链接:https://www.nvidia.cn/Download/index.aspx?lang=cn

下载之后是某一个.run的文件,不同显卡驱动版本可能不一样。

NVIDIA-Linux-x86_64-410.93.run

查看是否有NVIDIA的显卡

lspci | grep -i nvidia
uname -m && cat /etc/*release

有显卡信息代表显卡已经插好。

如果之前有旧的显卡驱动需要先卸载。
(1)进入文本模式:CTRL+ALT+F1

sudo apt-get remove nvidia-*
sudo apt-get autoremove

(2)Uninstall the drivers from the .run file

sudo nvidia-uninstall

(3)重启,之后安装新的驱动

 Ctrl+Alt+F1
 sudo service lightdm stop
 chmod +x NVIDIA-Linux-x86_64-410.93.run
 sudo ./NVIDIA-Linux-x86_64-410.93.run -no-x-check -no-nouveau-check -no-opengl-files

chmod将文件设为可执行,有时候不需要这一步,可以直接sudo ./NVIDIA…

 -no-x-check安装驱动时关闭x服务
 -no-nouveau-check 安装驱动时禁用Nouveau
 -no-opengl-files 安装时只装驱动文件,不安装Opengl

(4)重新打开界面

sudo service lightdm restart

重启之后发现屏幕分辨率改变则表示显卡驱动安装成功!

卸载CUDA

如果之前你有安装CUDA,换了新的显卡之后无法正常使用,则需要卸载CUDA,没有安装的话直接跳过这一步。

sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
sudo rm -rf /usr/local/cuda-8.0/

安装CUDA

✦CUDA 9.0
✦CUDNN 7_7.4
可以在官网,下载我们需要的CUDA版本。下载地址:https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal
在这里插入图片描述
下载好了之后给予文件执行权限

chmod +x cuda_9.0.176_384.81_linux.run

打开终端,cd 到这个文件夹下,然后安装

sudo ./cuda_9.0.176_384.81_linux.run

开始安装之后,需要阅读说明,可以使用Ctrl + C直接阅读完成,或者使用空格键慢慢阅读。然后进行配置,我这里说明一下:

(是否同意条款,必须同意才能继续安装)
accept/decline/quit: accept

(这里不要安装驱动,因为已经安装最新的驱动了,否则可能会安装旧版本的显卡驱动,导致重复登录的情况)
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
(y)es/(n)o/(q)uit: n

Install the CUDA 9.0 Toolkit?(是否安装CUDA 9 ,这里必须要安装)
(y)es/(n)o/(q)uit: y

Enter Toolkit Location(安装路径,使用默认,直接回车就行)
 [ default is /usr/local/cuda-9.0 ]:  

Do you want to install a symbolic link at /usr/local/cuda?(同意创建软链接)
(y)es/(n)o/(q)uit: y

Install the CUDA 9.0 Samples?(不用安装测试,本身就有了)
(y)es/(n)o/(q)uit: n

Installing the CUDA Toolkit in /usr/local/cuda-9.0 ...(开始安装)

这里注意默认目录最好不要改,容易给后续操作带来不便。最后,需要将CUDA添加到环境变量中,添加方法如下:

sudo gedit ~/.bashrc 

在文件末尾添加下面代码并保存。

export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64$LD_LIBRARY_PATH

注意这个是默认路径的环境变量添加方式,所以上一步点击默认的话,这两行命令直接复制。
之后更新环境变量:

source ~/.bashrc

使用nvcc -v查看有无CUDA版本信息,有则表示安装成功!

下载和安装CUDNN

到官网:https://developer.nvidia.com/rdp/cudnn-download 下载CUDNN,然后点击Download开始选择下载版本,在下载之前需要登录,选择版本界面如下,我们选择cuDNN Library for Linux
在这里插入图片描述
下载之后是一个压缩包,如下:

libcudnn7_7.4.1.5-1+cuda9.0_amd64.solitairetheme8

将其手动改为.tgz格式的文件
打开终端,cd 到这个文件夹下。然后对它进行解压,命令如下:

tar -zxvf libcudnn7_7.4.1.5-1+cuda9.0_amd64.tgz 

得到以下文件

cuda/include/cudnn.h
cuda/NVIDIA_SLA_cuDNN_Support.txt
cuda/lib64/libcudnn.so
cuda/lib64/libcudnn.so.7
cuda/lib64/libcudnn.so.7.4.2
cuda/lib64/libcudnn_static.a

使用以下两条命令复制这些文件到CUDA目录下:

cp cuda/lib64/* /usr/local/cuda-9.0/lib64/
cp cuda/include/* /usr/local/cuda-9.0/include/

拷贝完成之后,可以使用以下命令查看CUDNN的版本信息:

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

安装Tensorflow

pip install tensorflow-gpu

安装好了之后用import tensorflow测试一下,不显示信息代表安装成功!

以上总结是我参考了下面几位作者的博文写的,如果觉得这篇教程对你有帮助或启发,麻烦点个赞,谢谢!

[1] https://blog.csdn.net/qq_33200967/article/details/80689543
[2] https://zhuanlan.zhihu.com/p/37931050
[3] https://blog.csdn.net/ssmixi/article/details/73483795

猜你喜欢

转载自blog.csdn.net/qq_31148431/article/details/86606144