在ubuntu16.04服务器上安装tensorflow(GPU支持)

在ubuntu16.04服务器上安装tensorflow(GPU支持)

ubuntu16.04+CUDA Toolkit 9.0+cudnn7.0.5+tensorflow-gpu1.9.0+Anaconda3+python3.6

参考教程

采用Anaconda的方式安装


下载anaconda linux版本 适用于python3.6

wget -c https://repo.continuum.io/archive/Anaconda3-5.0.1-Linux-x86_64.sh

安装anaconda

bash Anaconda3-5.0.1-Linux-x86_64.sh

建立一个 conda 计算环境名字叫tensorflow:(anaconda3/envs/tensorflow文件夹中)

# Python 3.6
$ conda create -n tensorflow python=3.6

建立环境后会有 激活命令和关闭命令提示

# To activate this environment, use:
# > source activate tensorflow
#
# To deactivate an active environment, use:
# > source deactivate

这里转到启用GPU支持处,安装CUDA Toolkit 9.0 和 cuDNN v7.0.5 之后完成以下步骤。

接下来需要设置 Anaconda
激活tensorflow环境

source activate tensorflow

使用其中的 pip 安装
版本信息tensorflow_gpu_1.9.0

(tensorflow)$ pip install tensorflow-gpu==1.9.0

启用 GPU 支持

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。

安装


安装CUDA Toolkit9.0

确定GPU类型。
cuda官网下载 cuda toolkit 9.0

下载linux-x86_64-ubuntu-16.04-runfile(local)的Base Installer

使用runfile安装。
安装过程

sudo sh cuda_9.0.176_384.81_linux.run

输入accept回车,之后 y以及defult即可。
安装后尝试例子和修改环境变量。

配置文件

打开~/.bashrc文件:
sudo vim ~/.bashrc
将以下内容写入到~/.bashrc尾部:

export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH

测试CUDA的samples

cd  /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

如果显示一些关于GPU的信息,则说明安装成功。


配置cuDNN

cuDNN是GPU加速计算深层神经网络的库。
首先去官网(https://developer.nvidia.com/rdp/cudnn-download)下载cuDNN,可能需要注册一个账号才能下载。

下载

Download cuDNN v7.0.5 , for CUDA 9.0

下载cuDNN v7.0.5 Library for Linux
版本

(下载解压后会有文件夹cuda,使用操作3中的命令进行文件迁移就好了,操作完成就可以,下面是三步操作)

1.Navigate to your directory containing the cuDNN Tar file.下载
2.Unzip the cuDNN package.解压

$ tar -xzvf cudnn-9.0-linux-x64-v7.0.5.solitairetheme8

3.Copy the following files into the CUDA Toolkit directory.


$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include ##复制
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64  ##复制
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

安装cuda时问题

1.无法进入桌面you appear to be running an x server please exit x before installing

2.卸载cuda

3.nvidia-smi 命令解读

4.cuda:Missing recommended library: libGLU.so,libX11.so,libXi.so,libXmu.so

5.卸载tensorflow-gpu命令

(tensorflow) root@cc:/usr# pip uninstall tensorflow-gpu

卸载后直接用pip安装想要更新的版本即可

6.安装过程中很多版本不兼容的问题。

  • cuda driver版本越高越好,向下兼容。

  • CUDA Toolkit 9.0比较合适

  • TensorFlow1.3,TensorFlow1.4均默认寻找cudnn6.0

  • TensorFlow1.8,1.9,寻找cudnn7.0以及CUDA Toolkit9.0

7.libcudnn.so.6:cannot open sharedobjectfile: No such file or directory


安装Bazel(不需要)

使用方法一:Using Bazel custom APT repository (recommended)

安装其他依赖

# For Python 2.7:
$ sudo apt-get install python-numpy swig python-dev python-wheel
# For Python 3.x:
$ sudo apt-get install python3-numpy swig python3-dev python3-wheel

猜你喜欢

转载自blog.csdn.net/weixin_40113498/article/details/82969317
今日推荐