linux下 安装anaconda NVIDIA显卡驱动 cuda cudnn tensorflow-gpu 线下安装!

TensorFlow官方安装链接:https://tensorflow.google.cn/install/install_linux

 本文是我本人在装机学习深度学习tensorflow过程中的一些经验,仅供参考。如果觉得对你有帮助请帮忙点赞,如果对本文有意见、建议或是有提问,欢迎留言交流,谢谢! 此文为本人参照csdn和其他论坛十几篇博客,呕心沥血反复操作了4天(重装了几遍系统我就不说了..)做到这个程度已经不容易了,网说正常人两个星期装好这些算很不错的了。

 为了尽量客观公正准确不坑,文中附上各种博客链接和安装包下载链接供大家参考学习。

 推荐拿一块单独的盘(固态或机械都可以,本人单独配了一块闪迪的240G的固态,价位还算比较便宜)

 首先讲一下我的配置,基本也是大多数程序员的配置了吧。当然我的显卡算是比较渣的了..

CPU:AMD 锐龙7 1700X

GPU:GeForce GTX1060 6G

Ubuntu:16.04

软件版本:显卡驱动NVIDIA384版本,Anaconda3.6,CUDA9.0,cudnn7,Tensorflow1.5.0-gpu

后续步骤,建议大家使用 系统设置->备份 功能,操作失误还可还原回去。


第一步,当然是装系统ubuntu了

 自己拿UItraISO烧录一个官网下的ubuntu系统盘,记得不要听网上的说要在uitraiso里设置便捷启动,亲测无效。

 做好以后开机进入bios设置U盘(你做的系统盘)启动,选择install ubuntu,进去之后记得断网,因为你不断网会在后面的过程中下载很多东西,这会拖慢你的安装速度,这些东西可以在后面安装好后再更新下载。

还有要注意的就是最好清除整个磁盘来装系统,它会自动给你分配分区大小。我有之前按照网上的人说的,自己手动来分配。但是亲测之后发现分区大小不好拿捏,个别分区很容易用完,所以不推荐这样做。

亲测后发现系统自己分配的分区比较好,相信系统自动分配的分区吧骚年。

第二步,系统配置更新(要联网,网络一定要好)

 装好系统后开机,打开终端,输入sudo apt-get update sudo apt-get upgrade

 更新你的系统配置之类的东西,upgrade会下很多东西,目测几百兆,耐心等待。

 若遇到"无法获得锁"的问题,则要重新进行配置设置,输入 sudo dpkg --configure -a

第三步,安装anaconda

 参考链接:http://blog.csdn.net/woainishifu/article/details/74978647

 在你的安装位置右键打开终端,输入 bash <你下载的anaconda文件名>.sh

本人下载的 Anaconda3-5.0.1-Linux-x86_64.sh

后面就是 yes 默认安装路径之类的了,不再赘言。

 上面的安装过程执行完成之后关闭那个终端,重新打开一个,在终端输入“python”,如果出现python的版本信息,后面带了anaconda的标识,这就说明Anaconda安装成功了.


 此时输入exit()退出python环境,输入:conda list会显示一大堆可用的packages,说明我们的安装是没有问题的。如果不行,本人建议先重启电脑试试。下面这一行不要操作

 如果(重启电脑后)你在这一步输入python之后显示的还是系统默认的版本,那说明.bashrc的更新还没有生效,命令行输入source ~/.bashrc 

第四步,安装显卡驱动384版(很多同学都是因为这步而放弃深度学习的)

 NVIDIA显卡驱动链接:http://www.geforce.cn/drivers (如有需要)

 手动安装参考链接:http://blog.csdn.net/jasonzhangoo/article/details/54866049

 自动安装参考链接:http://blog.csdn.net/u014595019/article/details/53732015

 注意 CUDA8.0要求显卡驱动至少375,CUDA9.0要求显卡驱动至少384。

 推荐在 系统设置->软件与更新->附加驱动->NVIDIA Corporation 里面选择384版本安装,网上有说推荐这样做,也有推荐其他复杂的方法的,但经本人亲测后发现此方法最为快捷和稳妥。

 选好384后,点击应用更改,需要联网下载驱动,用时较长耐心等待,然后重启。搞定,就是这么简单。。。(好在本人在官网把驱动下下来了,所以每次重装不用再重复下载,别问我装了多少次)


查看显卡驱动,可以终端输入nvidia-smi,也可以在启动器搜索NVIDIA,打开就是NVIDIA显卡设置。


!!!注意,后面过程中很多时候你会遇到命令已安装但命令找不到之类的问题,本人测试后发现很多时候需要电脑重启后才能生效。

第五步,安装cuda8.0(最难)

 祭出cuda所有版本下载链接:https://developer.nvidia.com/cuda-toolkit-archive

安装链接:

本人下载的是9.0,我们在terminal中键入下列命令:

 sudo sh cuda_9.0.176_384.81_linux.run

 sudo gedit ~/.bash_profile# 打开.bash_profile 这是用户的环境变量,不是全局的

 然后在打开的文本末尾加入:

 export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"

 export CUDA_HOME=/usr/local/cuda

 保存并关闭后,输入下列命令使环境变量生效:source ~/.bash_profile # 使被更改的环境变量生效

 安装完毕后,再声明一下环境变量,并将其写入到 ~/.bashrc 的尾部:
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
 保存退出,运行source ~/.bashrc ,再测试是否安装成功
cd /usr/local/cuda/samples/1_Utilities/deviceQuery 
sudo make
./deviceQuery


通过nvcc -V来验证安装是否成功


第六步,安装cudnn(极容易)

祭出cudnn所有版本下载链接 https://developer.nvidia.com/rdp/cudnn-download

 本人下载的是 cudnn-8.0-linux-x64-v7

如果要使用gpu来对tensorflow进行加速,除了安装CUDA以外,cuDNN也是必须要安装的。跟cuda一样,去下载cuDNN的安装包。

 下载下来以后,发现是一个tgz的压缩包,使用tar进行解压
  tar -xvf cudnn-8.0-linux-x64-v5.1.tgz
 安装cuDNN比较简单,解压后把相应的文件拷贝到对应的CUDA目录下即可

然后在终端输入
  sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
  sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
  sudo chmod a+r /usr/local/cuda/include/cudnn.h
  sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

第七步,安装tensorflow-gpu

 tensorflow的github源:https://github.com/tensorflow/tensorflow(如有需要)

tensorflow的github中文源:https://github.com/jikexueyuanwiki/tensorflow-zh(如有需要)

 tensorflow的whl文件下载链接:https://pypi.python.org/pypi/tensorflow-gpu。想要什么版本直接在上面的链接后面加,如版本1.4.1,则在后面加‘/1.4.1

 我的方法是在python官网下载的whl文件安装tensorflow_gpu-1.5.0rc1-cp36-cp36m-manylinux1_x86_64.whl

 使用pip install XXX.whl来安装.whl的文件,一秒装好。来测试一下

  $ipython

 import tensorflow as tf 成功了别高兴的太早,下面操作验证一下你是不是装了个空壳子。

还可以再执行一条help(tf),如果里面不是空的,那么就恭喜你了!安装成功!

 (可不操作)最后,为了使tensorflow运行还需要安装libcupti-dev库,即NVIDIA CUDA配置文件工具界面。此库提供高级分析支持。要安装此库,请发出以下命令:$ sudo apt-get install libcupti-dev

附:run文件卸载

一种是说用 sh  virtualbox-3.1.6-59338-Linux_x86.run --uninstall,但是对于我这个virtualbox安装文件行不通
另一种是说进入到安装目录下,有个 uninstall 文件,输入./uninstall即可卸载,但不知道安装到哪了
于是我就用locate virtualbox | grep uninstall 找到这个文件,执行./uninstall就ok了

附:链接地址

anaconda在ubuntu中添加环境变量:http://blog.csdn.net/caomin1hao/article/details/78341568

(含装Bazel)ubuntu16.04下安装TensorFlow(GPU加速)----详细图文教程:http://blog.csdn.net/zhaoyu106/article/details/52793183

Ubuntu16.04安装CUDA+cuDNN+GPU版TensorFlow过程记录:http://blog.csdn.net/zwx2445205419/article/details/69429518

Ubuntu下如何安装TensorFlow:http://blog.csdn.net/tina_ttl/article/details/51762471

 ubuntu16.04下安装CUDA,cuDNN及tensorflow-gpu版本过程:http://blog.csdn.net/u014595019/article/details/53732015

 安装tensorflow(ubuntu):http://blog.csdn.net/yiliang_/article/details/62885543

Linux下CUDA+CUDNN+TensorFlow安装笔记:http://blog.csdn.net/m0_37924639/article/details/78785699

未参考:

ubuntu16.04 + cuda8.0安装配置:http://blog.csdn.net/iotlpf/article/details/54175064


猜你喜欢

转载自blog.csdn.net/luckoovy/article/details/79157252