HP Z840 安装Ubuntu18.04,gpu版的tensorflow,keras全程纪要,硬件Qurado P4000两块
Step1:安装SSH协议并开启(方便远程安装)
sudo apt-get update
sudo apt install openssh-client
sudo apt install openssh-server
sudo /etc/init.d/ssh start
Step2:安装apt-fast加快速度(可以不加)
sudo add-apt-repository ppa:apt-fast/stable
用命令更新源:sudo apt-get update
sudo apt-get install apt-fast
Step3:缺少gcc,先安装gcc
sudo apt-fast install gcc-6
sudo apt-get install g++-6
默认装在:/usr/bin
建立软连接:
cd /usr/bin
sudo ln -s gcc-6 gcc
sudo ln -s g++-6 g++
Step4:安装make 命令
sudo apt-fast install make
Step5:安装依赖项:
sudo apt-fast install tcl-dev tk-dev python3-tk
sudo apt-get install zlib1g-dev libbz2-dev libssl-dev libncurses5-dev libsqlite3-dev libreadline-dev tk-dev libgdbm-dev libdb-dev libpcap-dev xz-utils libexpat-dev
Step6:安装python,自带python Python 3.6.5,下载源文件3.6.7源码安装。
后面用import matplotlib.pyplot as plt 时会报错:ModuleNotFoundError: No module named 'tkinter',解决的办法就是apt 安装tcl-dev tk-dev python3-tk,再重新编译python3,但由于 自带的python3不能卸载(卸载会引发好多问题),因此采用新安装python3.6.7,然后再建立链接替换掉原来的python。如果不用tkinter相关的库,则可以跳过。
cd /home/sgiit/software/Python-3.6.7
./configure --with-ssl
sudo make –j32
sudo make install –j32
Step7:建立Python新的软连接
sudo rm /usr/bin/python3
sudo cp /usr/local/bin/python3 /usr/bin/
Step8:安装pip3,ipython
sudo apt-fast install ipython3
sudo pip3 install ipython
Step9:安装nvidia 410 驱动
方法1 apt安装
sudo apt-get purge nvidia*
sudo add-apt-repository ppa:graphics-drivers
sudo apt-get update
sudo apt-get install nvidia-driver-410
方法2 dpkg安装
执行以下四个命令:
sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
这一步把cuda10.0也装上了(10.0的版本GPU不支持),此时要把它卸载:
apt-get remove --purge cuda*
两种方法都可以,但记得安装显卡驱动之后重启,然后执行nvidia-smi,如果有输出,则证明显卡成功安装。
Step10安装CUDA 9.0
下载的文件是:
cuda_9.0.176_384.81_linux.run
安装命令如下:
chmod 777 cuda_9.0.176_384.81_linux.run
sudo ./ 777 cuda_9.0.176_384.81_linux.run
注意1:提示平台不兼容,选择Y,继续安装。
2: 提示是否安装nvidia-driver,选择N
3:剩余的默认即可。
4:最后会有提示cuda toolkit 成功安装。
Step11.添加cuda到路径中去
sudo gedit /etc/profile
在该文件末尾加上:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
source /etc/profile
执行nvcc --version,如果输出版本9.0,则cuda安装成功。
Step12.安装cudnn
官网:https://developer.nvidia.com/rdp/cudnn-download,下载runtime library\developer library\ code samples和cuDNN Library User Guide,共计三个文件。
sudo dpkg -i libcudnn6_6.0.21-1+cuda8.0_amd64.deb(对应的包,版本可能不一样)
sudo dpkg -i libcudnn6-dev_6.0.21-1+cuda8.0_amd64.deb
sudo dpkg -i libcudnn6-doc_6.0.21-1+cuda8.0_amd64.deb
Step13.安装tensorflow-gpu,及keras
sudo pip3 install tensorflow-gpu -i http://pypi.douban.com/simple --trusted-host ypi.douban.com
sudo pip3 install keras -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
最后安装结束:
输入:
ipython3
import tensorflow as tf
tf.__version__
没有报错,则OK。
可能出现的问题:
1.遇到Python安装常见问题(1):zipimport.ZipImportError: can't decompress data
sudo apt-fast install zlib*
然后重新执行 sudo make install –j32
2.使用pip3 时会报错Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'SSLError("Can't connect to HTTPS URL because the SSL module is not available.",)':----换个源,sudo pip3 install matplotlib -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
3.使用pip3时如果报错:subprocess.CalledProcessError: Command ‘(‘lsb_release’, ‘-a’)’ returned non-zero exit status 1.—
解决方法:
find / -name lsb_release
rm -rf /usr/bin/lsb_release
4. pip 下载慢,增加临时源 及永久源方式
Linux下,修改 ~/.pip/pip.conf (没有就创建一个文件夹及文件。文件夹要加“.”,表示是隐藏文件夹)
内容如下:
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[install]
trusted-host=mirrors.aliyun.com
5. 中途在pip3 安装库文件时曾经出现过no module name '_struct'等问题
后来用把/usr/bin/python3 的链接又重新指向 自带的/usr/bin/python3.6,就不存在这个问题。
此时,发现这个python3 也编程3.6.7 ,有点奇怪,未解。