Ubuntu16.0.4 系统下 Tensorflow1.12.0(gpu)版本安装过程!

一、前言

        Tensorflow是时下最火的深度学习框架,在github网站上的star数达到了12万之多,远远超过其他框架,如今赫赫有名的谷歌大脑项目所使用的框架就是tensorflow(当然了,这本身也是谷歌自己开发的)。而如今Tensorflow对Linux和Mac系统支持的比较完善,因此企业和科研机构越来越趋向于会选择在Linux系统上操作tensorflow。我最近在Ubuntu16.0.4 LTS 上安装tensorflow1.12.0版本,前后共花了两天多的时间,遇到了太多令人头疼的问题。为了给很多新手减轻负担,特地在此将我的安装过程记录下来,供大家参考,同时还会提供我在安装过程所遇到的问题的解决方案。之所以说是参考,是因为tensorflow框架以及相关的依赖环境等本身也在不断发展之中,再加上每个人的机器也不一样,即使你按部就班的按照官方教程去安装,也还是有可能遇到一些意想不到的问题。下面我将tensorflow(gpu版本)的安装过程详细的描述出来,由于我是在已经安装好tensorflow的情况下写出这篇文章的,所以很多命令的执行过程我就不展示了,而仅仅展示代码。

tensorflow官方网站:www.tensorflow.org

GitHub网站:www.github.com/tensorflow/tensorflow

模型仓库网址:www.github.com/tensorflow/models

二、安装过程

1.注意事项

        安装gpu版本的tensorflow,首先需要你的电脑上有至少一块NVIDIA系列显卡,如果只有Inter集成显卡或者AMD显卡,则本教程不适用。其次必须要安装CUDA和cuDNN,而且两者的版本必须要匹配兼容。再次,还需要安装python,目前tensorflow1.12.0仅支持Python3.6.8,不要安装3.7及以上版本。最后,还需要安装显卡驱动,显卡驱动也必须要与CUDA的版本匹配,否则可能导致使用tensorflow时出现问题。

2.安装Anaconda

        Anaconda是python的一个科学计算的开源发行版,内置了大多数python语言会经常使用的库,比如Numpy、SciPy、Scikit-learn等。anaconda提供了一个编译好的环境可以直接安装这些依赖库,而无须我们再去自己一个一个的安装,这样会耗费很多时间。还有就是在anaconda下安装tensorflow,它会自动安装相匹配的CUDA和cuDNN,而无需我们在手动去安装这两者,节省了很多的时间。

首先要去Anaconda官网下载相应的Linux系统的安装包,选择好安装包的下载地址,在对应的文件夹下打开终端执行下面的命令,即可自动安装:

bash Anaconda3-2018.12-Linux-x86_64.sh

安装过程中会出现一些提示,全部yes即可。不过最后一个提示是询问是否安装VS Code,这个看个人的情况了,如果你不想使用这个编译器,可以选择no。

3.安装tensorflow

注意目前anaconda最新版本内置的是python3.7的版本,而tensorflow1.12.0还不支持3.7,因此需要首先要创建python3.6.8的tensorflow环境:

conda create -n tensorflow python=3.6.8

中间会提示安装很多东西,一路yes就行。安装完后,会提示两个命令,一个是激活tensorflow环境,一个是退出环境,我们先激活tensorflow环境:

conda activate tensorflow

然后安装tensorflow,使用如下命令:

conda install tensorflow-gpu=1.12.0

安装过程中会下载很多工具,其中包括cuda和cudnn,这也是我强烈推荐大家使用anaconda安装tensorflow的原因之一,因为省事省时省力。

安装完以后,还需要安装显卡驱动。

4.安装NVIDIA显卡驱动

CUDA不同版本对显卡驱动版本要求不一样,因此需要查询自己已安装的CUDA版本所要求的驱动版本。网站是:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

我的电脑安装的是cuda9.2.0,因此需要安装396以上的显卡驱动。

首先添加NVIDIA显卡驱动的ppa源:

sudo add-apt-repository ppa:graphics-drivers/ppa

然后对源进行更新:

sudo apt-get update

查看当前系统可安装的显卡驱动:

sudo ubuntu-drivers devices

里面有一系列可安装的显卡驱动,使用如下命令安装对应版本的即可。

sudo apt-get install nvidia-版本号

安装完后需要重启,重启之后,打开终端,输入以下命令可以查看当前显卡驱动信息:

nvidia-smi

至此,整个tensorflow框架就已经配置好了!

三、可能遇到的问题及其解决方案

        大家在按照以上步骤配置tensorflow环境时,如果在安装过程中未出任何问题,那几乎是不可能的。下面是一些常见的可能会遇到的问题和解决办法。

1.在创建python3.6.8的tensorflow环境时,创建失败,一直停留在solving environment。

解决方案:首先要检查自己的网络是否是正常连接。如果是,在这种情况下,可以配置清华源,清华镜像由于在国内,因此很多工具可以无障碍下载。

2.condaHTTPerror问题:解决方案同上

3.安装tensorflow时部分工具无法下载:解决方案同上

4.测试tensorflow时出现CUDA driver version is insufficient for CUDA runtime version:显卡驱动与当前的cuda版本不匹配,需要升级到特定版本以上才行。

下面是清华的镜像设置命令(在此我还是劝大家,尽量不要使用官方官方镜像,官方镜像由于在海外,访问速度非常慢或无法访问):

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes

如果还是不行,可在home目录下找到.condarc文件,删掉channels下面的default一行。

若还是不行,可以将源更新为:

conda config --remove channels 'https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/'
conda config --remove channels 'https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/'
conda config --remove channels 'https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/'
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/

在此欢迎各位大神发表意见!

猜你喜欢

转载自blog.csdn.net/dulingwen/article/details/88565588
今日推荐