1. Desinstale o driver original
sudo apt remove *cuda*
sudo apt remove *nvidia*
sudo /usr/bin/nvidia-uninstall
sudo dpkg -l | grep ^rc | cut -d' ' -f3 | sudo xargs dpkg --purge
sudo rm -rf ~/.cuda-license-*
sudo apt purge nvidia-cuda-toolkit
sudo apt remove nvidia-driver-*
sudo apt purge nvidia-*
2. Desative o driver novo
Modifique /etc/modprobe.d/blacklist.conf
, é melhor adicionar o seguinte código
blacklist nouveau
options nouveau modeset=0
Execute o comando sudo update-initramfs -u
após reiniciar lsmod | grep nouveau
. Se nenhuma exibição for exibida, a desativação foi bem-sucedida.
3. Baixe e instale o driver
download
sudo wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
Instalar
sudo sh cuda_11.7.0_515.43.04_linux.run
Entre accept
para confirmar
e selecione Install
Instalar
Verificar
nvcc -V
nvidia-smi
outro
Docker executa runtime=nvidia especificado e relata um erro
unknown or invalid runtime name: nvidia
Causas Possíveis
Não instaladonvidia-container-runtime
solução
Execute a instalação nvidia-container-runtime
sudo apt install nvidia-container-runtime
Modificar/etc/docker/daemon.json
{
"registry-mirrors": [
"https://docker.mirrors.ustc.edu.cn",
"https://hub-mirror.c.163.com",
"https://registry.docker-cn.com"
],
"runtimes": {
"nvidia": {
"args": [],
"path": "nvidia-container-runtime"
}
}
}
Reinicie a janela de encaixe
sudo systemctl daemon-reload
sudo systemctl restart docker