Ambiente necesario
- ventana acoplable19.03+
- nvidia-container-toolkit
Instala la última versión de docker
Desinstalar la ventana acoplable original
sudo yum remove docker \
docker-client \
docker-client-latest \
docker-common \
docker-latest \
docker-latest-logrotate \
docker-logrotate \
docker-engine
instalar dependencias
sudo yum update -y && sudo yum install -y yum-utils device-mapper-persistent-data lvm2
Agregar repositorio oficial de yum
sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
instalar ventana acoplable
sudo yum install -y docker-ce docker-ce-cli containerd.io
Ver la versión de la ventana acoplable
docker --version
bota
systemctl enable --now docker
Configurar aceleración de fuente nacional
vi /etc/docker/daemon.json
{
"registry-mirrors": [
"https://registry.docker-cn.com",
"http://hub-mirror.c.163.com"
]
}
systemctl daemon-reload
systemctl restart docker
Instalación y actualización del controlador Nvidia
Instalar o actualizar controladores
# 安装/更新驱动
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
yum install -y kmod-nvidia
# 重启 需重启才可生效
reboot
Comprobar si funciona
nvidia-smi
Instalar nvidia-docker
Ejecutar el comando de instalación
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo
# 安装
yum install -y nvidia-container-toolkit
# 重启docker
systemctl restart docker
Probar si la instalación es exitosa
# 启动所有GPU支持的GPU docker
docker run --gpus all nvidia/cuda:11.0-base nvidia-smi
# 指定GPU个数,并启动GPU docker.
docker run --gpus 1 nvidia/cuda:11.0-base nvidia-smi
# 指定GPU id,并启动GPU docker.
docker run --gpus '"device=1"' nvidia/cuda:11.0-base nvidia-smi