HP Z840 安装Ubuntu18.04,gpu版的tensorflow,keras全程纪要,硬件Qurado P4000两块

HP Z840 安装Ubuntu18.04gpu版的tensorflowkeras全程纪要,硬件Qurado P4000两块

Step1:安装SSH协议并开启(方便远程安装)

sudo apt-get update

sudo apt install openssh-client 

sudo apt install openssh-server 

sudo /etc/init.d/ssh start 

Step2安装apt-fast加快速度(可以不加)

sudo add-apt-repository ppa:apt-fast/stable

用命令更新源:sudo apt-get update

sudo apt-get install apt-fast

Step3缺少gcc,先安装gcc

sudo apt-fast install gcc-6

sudo apt-get install g++-6

默认装在:/usr/bin

建立软连接:

cd /usr/bin

sudo ln -s gcc-6 gcc

sudo ln -s g++-6 g++

Step4:安装make 命令

sudo apt-fast install make

Step5:安装依赖项:

    sudo apt-fast install tcl-dev tk-dev python3-tk

sudo apt-get install zlib1g-dev libbz2-dev libssl-dev libncurses5-dev  libsqlite3-dev libreadline-dev tk-dev libgdbm-dev libdb-dev libpcap-dev xz-utils libexpat-dev

Step6:安装python,自带python Python 3.6.5,下载源文件3.6.7源码安装。

后面用import matplotlib.pyplot as plt 时会报错ModuleNotFoundError: No module named 'tkinter',解决的办法就是apt 安装tcl-dev tk-dev python3-tk,再重新编译python3,但由于 自带的python3不能卸载(卸载会引发好多问题),因此采用新安装python3.6.7,然后再建立链接替换掉原来的python。如果不用tkinter相关的库,则可以跳过。

cd /home/sgiit/software/Python-3.6.7

./configure  --with-ssl 

sudo make –j32

sudo make install –j32

Step7建立Python新的软连接

sudo rm /usr/bin/python3

sudo cp /usr/local/bin/python3 /usr/bin/

Step8安装pip3ipython

sudo apt-fast install  ipython3

sudo pip3 install ipython

Step9:安装nvidia 410 驱动

方法1 apt安装

sudo apt-get purge nvidia*

sudo add-apt-repository ppa:graphics-drivers

sudo apt-get update

sudo apt-get install nvidia-driver-410 

方法2 dpkg安装

  官网下载deb文件:https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=debnetwork

执行以下四个命令:

sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb

sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub

sudo apt-get update

sudo apt-get install cuda

这一步把cuda10.0也装上了(10.0的版本GPU不支持),此时要把它卸载:

apt-get remove --purge cuda*

两种方法都可以,但记得安装显卡驱动之后重启,然后执行nvidia-smi如果有输出,则证明显卡成功安装。

Step10安装CUDA 9.0

   官网下载:https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1704&target_type=runfilelocal

下载的文件是:

cuda_9.0.176_384.81_linux.run

安装命令如下:

chmod 777 cuda_9.0.176_384.81_linux.run

sudo ./ 777 cuda_9.0.176_384.81_linux.run

注意1:提示平台不兼容,选择Y,继续安装。

    2: 提示是否安装nvidia-driver,选择N

     3:剩余的默认即可。

    4:最后会有提示cuda toolkit 成功安装。

Step11.添加cuda到路径中去

sudo gedit  /etc/profile

在该文件末尾加上:

export PATH=/usr/local/cuda-9.0/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH

source /etc/profile

    执行nvcc  --version,如果输出版本9.0,则cuda安装成功。

Step12.安装cudnn

官网:https://developer.nvidia.com/rdp/cudnn-download,下载runtime library\developer library\ code samples和cuDNN Library User Guide,共计三个文件。

sudo dpkg -i libcudnn6_6.0.21-1+cuda8.0_amd64.deb(对应的包,版本可能不一样)

sudo dpkg -i libcudnn6-dev_6.0.21-1+cuda8.0_amd64.deb

sudo dpkg -i libcudnn6-doc_6.0.21-1+cuda8.0_amd64.deb

Step13.安装tensorflow-gpu,及keras

sudo pip3 install tensorflow-gpu  -i http://pypi.douban.com/simple --trusted-host ypi.douban.com

sudo pip3 install keras  -i  http://pypi.douban.com/simple --trusted-host pypi.douban.com

 

最后安装结束:

输入:

ipython3

import tensorflow as tf

tf.__version__

没有报错,则OK。

可能出现的问题:

1.遇到Python安装常见问题(1):zipimport.ZipImportError: can't decompress data

sudo apt-fast install zlib*

然后重新执行 sudo make install –j32

2.使用pip3 时会报错Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError("Can't connect to HTTPS URL because the SSL module is not available.",)':----换个源,sudo pip3 install matplotlib -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

3.使用pip3时如果报错:subprocess.CalledProcessError: Command ‘(‘lsb_release’, ‘-a’)’ returned non-zero exit status 1.

解决方法

find / -name lsb_release
rm -rf /usr/bin/lsb_release

4. pip 下载慢,增加临时源 及永久源方式

Linux下,修改 ~/.pip/pip.conf (没有就创建一个文件夹及文件。文件夹要加“.”,表示是隐藏文件夹)

内容如下:

[global] 
index-url = https://pypi.tuna.tsinghua.edu.cn/simple 
[install] 
trusted-host=mirrors.aliyun.com 

5. 中途在pip3 安装库文件时曾经出现过no module name '_struct'等问题

   后来用把/usr/bin/python3 的链接又重新指向 自带的/usr/bin/python3.6,就不存在这个问题。

   此时,发现这个python3 也编程3.6.7 ,有点奇怪,未解。

 

猜你喜欢

转载自blog.csdn.net/weixin_40755306/article/details/84888332