记一次成功的 Ubuntu16.04.4 + Cuda9.0 + Cudnn7

半年前我曾发起过数次战役,尽管我知道笔记本的性能跑深度学习不是那么好,但我还是幻想拥有自己的可以跑GPU的深度学习便携式平台,于是有了十次左右的重装Ubuntu的惨痛经历(其实也不能说惨,过程中学到的东西还是不少的)。半年后还是不甘心想再尝试一下。功夫不负有心人,今天终于成功了。下面我就分享一下思路和经验:

一、系统及基本环境:

主要参照官网的documentation,一定要仔细看,不懂的地方google、baidu 。

官网安装cuda指导文件地址: https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html

参照下表以及表下面的一句提示信息,决定装一个ubuntu16.04.4系统,特别指出其搭载的kernel版本是4.13.x 但适用,其他必要条件都满足。

(我的是windows10 + ubuntu16.04.4的双系统,怎么装baidu都有)

系统安装好之后,先解决基本条件。我安装的是python3.6,及anaconda3的相应版本,为之后的pytorch考虑。

二、严格执行documentation里的 2.pre-installation actions ,安装方式选择runfile ,下载相应文件 。

三、跳过3. 执行 4.runfile installation :

按4.2中的步骤,执行到 5.Run the installer and follow the on-screen prompts 会遇到如下问题:

( 先说明这一部分参考的来源:https://www.jianshu.com/p/c2215c74a8fe ,感谢这位大佬带我走出困境 )

"The driver installation is unable to locate the kernel source.
 Please make sure that the kernel source packages are installed and set up correctly. 
If you know that the kernel source packages are installed and set up correctly, 
you may pass the location of the kernel source with the '--kernel-source-path' flag."
解决办法:

设置>软件与更新>


运行runfile里面nvidia显卡驱动安装程序时会出现问题,但如上所示的安装方法亲测有效。


再次运行,安装nvidia驱动选(no) ,然后会遇到另一个问题:

Installing the CUDA Toolkit in /usr/local/cuda-8.0 ...
Missing recommended library: libGLU.so 
Missing recommended library: libXmu.so

解决办法:

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev 

然后运行runfile的时候安装nvidia驱动的那一项选(no)就ok了。

四、继续执行4.2的6、7、8,确认安装。

五、安装cudnn:

这一部分也是参照官网的guide: https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#install-linux

选择安装方式的时候选择 debian 安装,理由是可以检验安装是否成功。

严格做下来就ok了。

六、( 自选 )pytorch安装:

进入官网 :https://pytorch.org

没有梯子进不去的话执行下面这个:

conda install pytorch torchvision cuda90 -c pytorch

( 七、Tensorflow 后面有时间再装 )

总结:写的比较简略,但毕竟是成功案例,思路上没有问题,严格执行的话可以重现。

猜你喜欢

转载自blog.csdn.net/achcxchca/article/details/81032343
今日推荐