Ubuntu17.10+Cuda9.2+Cudnn7.1+Anaconda+tensorflow 深度学习环境搭建

机缘巧合之下安装ubuntu17.10过程一堆坑,在帖子中记录一下。
过程中参考以下及若干链接,感谢感谢!!


过程如下:
1 安装驱动
显卡驱动中,拒绝手动,一堆坑。本文中显卡为GTX1080.
软件与更新(全部)-〉 附加驱动 -> nvidia corporation GP104 



安装后结果

384版本的驱动
2 安装CUDA
2.0安装之前的一些说明:
    1)  Cuda8.0并不支持17版本!!!所以这里只能安装Cuda9.0(网上安装8.0的教程其实里面也全是安装的9.0),本文中安装的是uda版本已经是9.2
    2) 直接用Linux下载非常慢,推荐使用windows找一个好的地方下载好,u盘转到linux下的home 文件夹
    3) 安装之前参考官方安装指导链接( https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html)尤其注意Pre-installation Action部分。
2.1安装之前的准备:
    对应于官方文档的,linux版本信息,NVIDIA GPU信息等,参考:
     本节中主要遇到 gcc版本太高的问题及安装过程依赖的包未装问题,解决方法如下:
    1 )安装 gcc-5
    
 
sudo add-apt-repository ppa:ubuntu-toolchain-r/test
sudo apt-get update

 
sudo apt-get install gcc-5 gcc-5-multilib g++-5 g++-5-multilib 
此时  gcc --version发现还是7.2版本,更新系统默认gcc为gcc-5
 
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 40   
  
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 50  
  
sudo update-alternatives --config gcc  
    其中 最后数字为优先级,该数字越高优先级越高,40,50的区别
(https://www.linuxidc.com/Linux/2017-03/142299.htm)
结果如下:

同样设置g++:
 
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50   
  
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 40  
  
sudo update-alternatives --config g++  
此时用   gcc --version查看为5.0版本
    2) 按装依赖的包
 
sudo apt-get install g++ freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev 
3 安装CUDNN
3.1 获取cuda安装  文件
这个cuda有两个安装方式:一个是runfile,另一个是deb。 
选择第一个runfile下载。

选17.10!!!!!否则下不到合适的安装文件,注意下载下来应该为9.0+版本
本文下载的文件为
本文版本:
 
cuda_9.2.88_396.26_linux.run

3.2 安装
 
chmod +x cuda_9.2.88_396.26_linux.run   
sudo sh cuda_9.2.88_396.26_linux.run
#上句不成功时尝试如下
sudo sh cuda_9.2.88_396.26_linux.run -override 
安装过程, 选项install nvidia accelerated Graphics Driver (驱动需要选 n (NO), 原因已经安好驱动(第一步),系统自带驱动坑略多,其余默认。

3.3. 更改配置件
sudo gedit  ~/.bashrc
添加
export PATH=/usr/local/c uda- 9.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/loca l/cuda- 9.2 /lib64:$LD_LIBRARY_PATH
保存
重启ubuntu
3.4 检验cuda是否安装成功
1
cuda- install -samples-9.0.sh < dir >  安装测试程序,< dir >是安装目录,自己新建一个即可

安装好后,<dir>下有个NVIDIA_CUDA-9.0_Samples文件夹,cd到这个文件夹里面,执行$sudo make,编译完后,在bin目录或bin目录的子目录的子目录里有编译好的deviceQuery可执行文件,执行这个文件,可以看到下面的输出就说明安装成功了:

如果执行失败,则是显卡驱动没有装好。

最后再来测试一下CUDA,运行:

1
sudo  nvidia-smi

可以看到gpu的各种信息。



4 安装cudnn
4.1 下载
1) 版本问题:
CUDA8.0对应的cuDNN版本是5.1,CUDA9.0对应的cuDNN7.0。同时,cuDNN可以同时安装在CUDA8.0和9.0中,而cuDNN7.0只能对CUDA9.0及以上适用。
cuda, cudnn, tensorflow之间版本的对应关系
2) 下载
官方链接:
(下载前需要登录网站,因此需要进行注册)
本文中版本:
 
cudnn-9.2-linux-x64-v7.1.tgz
3) 解压及安装
 
# 版本信息 cudnn-9.2-linux-x64-v7.1.tgz
mkdir cuda
mv cudnn-9.2-linux-x64-v7.1.tgz cuda/
cd cuda/
gunzip cudnn-9.2-linux-x64-v7.1.tgz
tar xvf cudnn-9.2-linux-x64-v7.1.tar
cd cuda/
cd ..
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
5 安装annaconda
# python 3.6版本:
wget https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86_64.sh  
# python 2.7版本:
https://repo.continuum.io/archive/Anaconda2-5.0.1-Linux-x86_64.sh  
#手动下载,链接
chmod +x Anaconda3-5.0.1-Linux-x86_64.sh
./Anaconda3-5.0.1-Linux-x86_64.sh
提示加入环境变量 输入yes
source ~/.bashrc

annaconda 安装teansorflow
#通过清华的pip源,用这种方式安装tensorflow-gpu版本速度很快
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
conda install --channel https://conda.anaconda.org/jjh_cio_testing tensorflow-gpu
7 最终测试

我们在ipython中试一下新安装好的Tensorflow:

Python 2.7.13 (default, Jan 19 2017, 14:48:08) Type "copyright", "credits" or "license" for more information.   IPython 5.1.0 -- An enhanced Interactive Python. ? -> Introduction and overview of IPython's features. %quickref -> Quick reference. help -> Python's own help system. object? -> Details about 'object', use 'object??' for extra details.   In [1]: import tensorflow as tf   In [2]: hello = tf.constant('Hello, Tensorflow')   In [3]: sess = tf.Session() 2017-09-01 13:32:08.828776: I tensorflow/core/common_runtime/gpu/gpu_device.cc:955] Found device 0 with properties: name: GeForce GTX 1080 major: 6 minor: 1 memoryClockRate (GHz) 1.835 pciBusID 0000:01:00.0 Total memory: 7.92GiB Free memory: 7.62GiB 2017-09-01 13:32:08.828808: I tensorflow/core/common_runtime/gpu/gpu_device.cc:976] DMA: 0 2017-09-01 13:32:08.828813: I tensorflow/core/common_runtime/gpu/gpu_device.cc:986] 0: Y 2017-09-01 13:32:08.828823: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1045] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 1080, pci bus id: 0000:01:00.0)   In [4]: print(sess.run(hello)) Hello, Tensorflow



发布了36 篇原创文章 · 获赞 0 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/weixin_38102912/article/details/80518377
今日推荐