深度学习环境配置:2080ti显卡驱动+ubuntu16.04+cuda10+cudnn7.3+tensorflow_gpu1.12

转载:https://blog.csdn.net/yt1242228309/article/details/84863949

第一步:装系统(Ubuntu16.04)

我这个是浪潮工作站,安装系统会麻烦一点

(1)为了安全起见,我把其他的硬盘都取出来,只留一个(一共四个硬盘)。

(2)进入bios换成板载显卡和vga接口,重启

(3)安装系统

参考文献:https://jingyan.baidu.com/article/3c48dd348bc005e10be358eb.html

    (切记:安装第三方软件要打勾,这样虽然慢,但是安装得比较全。)

(4)系统安装后,进入bios换成外显卡,dp接口,重启电脑

(5)解决分辨率问题:https://jingyan.baidu.com/article/3c48dd348bc005e10be358eb.html

(6)安装2080ti显卡驱动:先到官网下载驱动,安装教程https://blog.csdn.net/xx_katherine/article/details/77754179

第二步:联网(用的是校园网)

这一步试了很多办法,也弄了很久,因为是校园网,且我们学校没有对应的linx锐捷认证软件,最后是去找的别人做的软件

(1)下载和安装教程:http://wiki.ubuntu.org.cn/%E9%94%90%E6%8D%B7%E3%80%81%E8%B5%9B%E5%B0%94%E8%AE%A4%E8%AF%81MentoHUST

(2)依然出现问题(不允许使用的客户端类型” ),解决办法http://blog.sina.com.cn/s/blog_4d70207c0102vmnu.html

最后连上网了,(系统装双系统的话,卸载window10的网卡,然后重新安装ubunutu也能连上网,但是暂时的,只要切换到window系统在切到ubuntu系统又没网了。)

(3)连上网后,先禁掉系统内核更新https://blog.csdn.net/fengliang4616/article/details/83932767(我之前配好的环境,系统自动内核更新,然后当时又不懂,进入了更新后的内核系统,环境全没了,又重新安装的系统,配环境)在软件与更新那里也把所有更新的关闭了。

第三步:安装cuda10.0+cudnn7.3

(1)先下好对应版本的cuda10.0和cudnn7.3

(2)安装安装依赖包 

sudo apt-get update
lsmode | grep nouveau
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
sudo update-initramfs -u

可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple,特别好用的东西

(3)安装cuda10.0

lsmod | grep nouveau  查看是否禁用 nouveau

chmod +x cuda_10.0.130_410.48_linux.run
sudo sh cuda_10.0.130_410.48_linux.run
 reboot
 sudo gedit ~/.bashrc
export PATH=/usr/local/cuda-10.0/bin:$PATH  
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH
source ~/.bashrc
 nvcc --version

到这里就安装好了cuda

(4)安装cudnn7.3

到下载目录下

sudo cp cuda/include/cudnn.h /usr/local/cuda-10.0/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.0/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda-10.0/lib64/libcudnn*
source ~/.bashrc
nvcc --version
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
 ls
 cat /usr/local/cuda/version.txt
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

到这里cudnn7.3安装好了

第四步:安装tensorflow_gpu1.12

这个时候还没有出cuda10对应的tensorflow_Gpu,我用的是外网别人写的,先进的东西找不到,还是多去google看看吧

https://github.com/tensorflow/tensorflow/issues/22706

sudo apt-get install python3-pip python3-dev

pip3 install tensorflow-1.12.0rc2.748435b.AVX2.CUDA10-cp35-cp35m-linux_x86_64.whl

最后就可以用2080ti跑深度学习的环境了,虽然配环境的过程很痛苦(装系统就不下30遍了吧,然后还各种出问题)。

猜你喜欢

转载自blog.csdn.net/yaningli/article/details/88222511