Ubuntu Nivdia-Docker的安装

这东西可把我折磨了一阵,各种版本兼容问题…

windows的安装一向简单,这里只说Liunx,我用的是Ubuntu18.04

在开始之前你需要明白,Nivdia-Docker并不是一个独立的软件,他相当于一个docker的插件。而且在安装之前,你需要安装CUDA这个软件。(安装cuda)

强烈建议你先往下看再去安装!!!

你需要注意的是,这里的教程安装的是8.0版本。这就又涉及到显卡驱动版本的问题(我在这里卡了几天)见下图:
分清windows和Liunx
分清楚分清windows和Liunx

也就是说显卡的版本越高,CUDA的版本越高。
ubuntu查看自己的显卡版本:
执行命令:

nvidia-smi

在这里插入图片描述
Driver Version 就是驱动版本

由于驱动越新对显卡的性能发挥越好,所以我选择啥都装最高的。
首先更新你的显卡驱动,上图是我写博客时驱动最新了。

1.去官网下载驱动 官网

2.卸载原有N卡驱动

#for case1: original driver installed by apt-get:
sudo apt-get remove --purge nvidia*

#for case2: original driver installed by runfile:
sudo chmod +x *.run
sudo ./NVIDIA-Linux-x86_64-384.59.run --uninstall

如果原驱动是用apt-get安装的,就用第1种方法卸载。
如果原驱动是用runfile安装的,就用–uninstall命令卸载。其实,用runfile安装的时候也会卸载掉之前的驱动,所以不手动卸载亦可。

3.禁用nouveau驱动

sudo gedit /etc/modprobe.d/blacklist.conf

在文本最后添加:(禁用nouveau第三方驱动,之后也不需要改回来)

blacklist nouveau
options nouveau modeset=0

然后执行:

sudo update-initramfs -u

4.命令行安装驱动

#给驱动run文件赋予执行权限:
sudo chmod +x NVIDIA-Linux-x86_64-384.59.run
#后面的参数非常重要,不可省略:
sudo ./NVIDIA-Linux-x86_64-384.59.run –no-opengl-files

–no-opengl-files:表示只安装驱动文件,不安装OpenGL文件。这个参数不可省略,否则会导致登陆界面死循环,英语一般称为”login loop”或者”stuck in login”。
–no-x-check:表示安装驱动时不检查X服务,非必需。
–no-nouveau-check:表示安装驱动时不检查nouveau,非必需。
-Z, --disable-nouveau:禁用nouveau。此参数非必需,因为之前已经手动禁用了nouveau。
-A:查看更多高级选项。

这里我在后面加入–no-opengl-files会报错,请根据实际情况来安装,我安装的时候没加,但没有出现死循环的情况,应该因人而异,慎重!慎重!

安装完之后在执行 nvidia-smi 一下,若弹出信息则安装成功。

到这里就可以安装CUDA了,按照表的安装,可能会更新,最好自己查一下,我安装的是最新的cuda10.2。安装步骤上面的链接有。

到这里终于可以安装Nivdia-Docker了。
正像前面说的Nivdia-Docker只是插件,首先安装docker点击查看
这个比较简单,没得哈要说的直接按照链接安装就行。

所有东西准备完毕,最后一步:
(以下内容摘自Nivdia-Docker官方说明文档)

#如果你安装了nvidia-docker 1.0:我们需要删除它和所有现有的GPU容器  
docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
sudo apt-get purge -y nvidia-docker

#添加软件包存储库
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
  sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
  sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update

# 安装nvidia-docker2并重新加载Docker守护程序配置
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd

# 测试nvidia-smi与最新官方CUDA图像
docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi

注意这里的语句:cuda:9.0-base nvidia-smi
你安装的是什么版本就要输入什么,我的是cuda:10.1-base nvidia-smi

最后如果安装过程中出现
安装 nvidia-docker2报错“下列软件包有未满足的依赖关系:”
可以参照我的另一篇博客
点击进入

测试如图所示:

在这里插入图片描述

安装完成

发布了36 篇原创文章 · 获赞 7 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/qq_41807801/article/details/91578644