Ubuntu16.04系统GPU深度学习环境搭建

安装Ubuntu16.04.5系统

安装过程就不详述了。

安装NVIDIA1080Ti显卡驱动

ll /etc/modprobe.d/blacklist.conf

sudo chmod 666 /etc/modprobe.d/blacklist.conf

sudo vi /etc/modprobe.d/blacklist.conf
在最后一行加上:
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb
保存退出

sudo chmod 644 /etc/modprobe.d/blacklist.conf

sudo update-initramfs –u
然后重启

重启之后:
lsmod | grep nouveau

sudo apt-get purge nvidia*

sudo add-apt-repository ppa:graphics-driversa

sudo apt-get update

sudo apt-get install nvidia-384 nvidia-settings

注意:因为如果安装成功后,重启会出现循环登录的问题,这时需要卸载NVIDIA驱动即可
解决,但是因为需要用到这个驱动,所以不能卸载,所以这个问题不能解决,只能通ssh远程连接服务器操作,所以需要开启ssh服务。

开启SSH服务:
sudo apt-get install openssh-server

sudo service ssh start

sudo vi /etc/ssh/sshd_config
找到:PermitRootLogin prohibit-password
改为:PermitRootLogin yes
保存退出。

sudo service ssh restart

然后用ssh工具远程连上服务器之后(记住账号和密码)

重启电脑

nvidia-smi

查看生效的显卡驱动:

在这里插入图片描述
则成功。

安装前说明
1.前提是机器上必须有Nvidia显卡,不太老就好(配置不好的也没必要玩这个了吧,费
电),在Nvidia官网可以在这里查到显卡支持情况安装过程中的命令都需要root身份,请用su root切换或者每次加 sudo,编译运行测试代码使用普通用户就好。
2.必须按tensorflow 官网提示的版本安装 1.9 对应 CUDA 9.0,CUDA 9.0 要下载相应版本的7.0cuDNN。
3.如果喜欢折腾,建议使用没有重要数据的硬盘。
4.安装包最好下载到其他电脑上,使用scp拷贝到安装机上,重装了几ubuntu,下一次包就2个G
原因:安装前提必须是Nvidia显卡

安装CUDA

下载地址:https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=deblocal

如果没有账号密码就先注册。
在这里插入图片描述
然后:

在这里插入图片描述
下载。
然后,将这两个文件拷贝到/home/erc/下载/目录下,然后切换到这个路径下
sudo dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb
如果出现:
在这里插入图片描述
就执行:
sudo apt-key add /var/cuda-repo-9-0-local/7fa2af80.pub
然后在执行:
sudo dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb

sudo apt-get update

sudo apt-get install cuda

sudo dpkg -i cuda-repo-ubuntu1604-9-0-local-cublas-performance-update-2_1.0-1_amd64.deb

sudo apt-get update

sudo apt-get upgrade cuda

然后设置环境变量:

Vi ~/.bashrc
在末尾添加:
export PATH=/usr/local/cuda/binKaTeX parse error: Expected '}', got 'EOF' at end of input: {PATH:+:{PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64KaTeX parse error: Expected '}', got 'EOF' at end of input: …LIBRARY_PATH:+:{LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda

保存后,运行 source ~/.bashrc 使其生效。

安装cuDNN

进入https://developer.nvidia.com/compute/machine-learning/cudnn/secure/v7.3.0/prod/9.0_2018920/cudnn-9.0-linux-x64-v7.3.0.29,选择Download cuDNN v7.3.0 (Sept 19, 2018), for CUDA 9.0的cuDNN v7.3.0 Library for Linux。
然后将cudnn-9.0-linux-x64-v7.3.0.29.tgz传输到/usr/local/cuda-9.0目录下
tar -zxvf cudnn-9.0-linux-x64-v7.3.0.29.tgz

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d

cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery

make

./ deviceQuery
出现:
在这里插入图片描述
表示安装成功。

提醒
cuda安装时会将源文件装在/usr/local/cuda-9.0下,然后会创建一个/usr/local/cuda的链
接,所以在安装tensorflow设置cuda和cudnn路径以及拷贝cudnn文件到cuda文件夹下时,注意使用真实的路径。

sudo apt-get update

可能出现问题:

问题1:

Failed to fetch http://……
解决:
如果无法连接到某网络,一般是由于直接使用国外的源无法连接的原因导致的。解决方案是,直接替换成国内的源即可。
参考http://blog.csdn.net/paincupid/article/details/52895676,可以使用阿里的源,速度较快。

问题2:

Could not get lock /var/lib/dpkg/lock
解决:
导致此问题的原因是由于上次更新没有正常进行导致的。解决方案是,直接将lock的文件删掉。
参考:http://www.linuxidc.com/Linux/2014-06/103437.htm
sudo rm /var/lib/dpkg/lock

问题3:

Ubuntu 16.04出现:Problem executing scripts APT::Update::Post-Invoke-Success ‘if /usr/bin/test -w /var/cache/app-info -a -e /usr/bin/appstreamcli; then appstreamcli refresh > /dev/null; fi’
解决:
http://www.cnblogs.com/EasonJim/p/7343892.html

以上深度学习环境安装:
也可参考:https://blog.csdn.net/weixin_40294256/article/details/79157838

python库的安装

wget http://www.python.org/ftp/python/3.7.0/Python-3.7.0.tgz

tar -xvzf Python-3.7.0.tgz

cd Python-3.7.0

./configure --with-ssl

make

sudo make install

sudo pip install tensorflow-gpu==1.9

sudo pip install niftynet

sudo pip install numpy

sudo pip install scikit-image

sudo pip install pydicom

sudo pip install dicom2nifti

sudo pip install nibabel

最终环境

Ubuntu16.04.5
NVIDIA1080Ti显卡驱动
CUDA9.0
cuDNN7.0
python3.7.0

猜你喜欢

转载自blog.csdn.net/qq_28822933/article/details/83308823