[Ubuntu] [Prueba personal disponible] Acerca de instalar los controladores Ubuntu20.04 y Nvidia y CUDA Toolkit y agregar Pytorch en Anaconda para verificar si CUDA está disponible

1. Utilice rufus para crear un disco de arranque de Ubuntu

Luego, como se muestra a continuación, comience

Después de comenzar, aparecerá un cuadro que le pedirá que elija el modo ISO o DD. Se debe prestar especial atención al hecho de que elegí el modo de duplicación DD.

Con respecto a la diferencia entre los modos ISO y DD, puedes echar un vistazo aquí: boot - ¿La escritura en disco de imagen DD es permanente? - Pregunta a Ubuntu

Sólo hay una razón por la que uso el modo DD:

Después de instalar usando la imagen ISO, al iniciar Ubuntu, siempre aparece el mensaje "Se admite la edición de líneas mínimas tipo BASH..." y luego la línea de comando del símbolo de grub. He probado muchos métodos en Internet pero no puedo resolverlo. entonces puedo usar el método de imagen DD para resolver el problema.

En cuanto a por qué aparece este mensaje, lo más probable es que destruí el área de inicio mediante algunas operaciones aleatorias. En ese momento, después de instalar Ubuntu e instalar el controlador Nvidia, reinicié e inicié sesión en Ubuntu. La pantalla estaba negra y no pude No veo el escritorio, solo el mouse, y luego comencé a operar a ciegas.

——¡Después de varias operaciones, elegí el modo de duplicación DD actual! En cuanto al motivo de la pantalla negra después de iniciar sesión, hablaremos de ello más adelante.

2. Instale el controlador Nvidia

2.1 Verifique si hay una GPU Nvidia

Ejecute este comando primero

lspci | grep -i nvidia

hay un resultado

Intentar otra vez

nvidia-smi

El resultado es comando no encontrado

Significa que el controlador de la GPU no está instalado.

2.2 Instalar el controlador de GPU

2.2.1 Instalar gcc y crear

Como comencé a usarlo después de la instalación, descubrí que gcc y make no estaban instalados.

Ejecute el comando para instalarlo.

sudo apt install gcc
sudo apt install make
2.2.2: Deshabilitar y desinstalar el controlador nouveau

Lo nuevo es la razón por la cual aparece la pantalla negra después de instalar el controlador Nvidia.

Mi propia forma de solucionarlo es deshabilitarlo y eliminarlo:

(1) Desactivar nuevo

Abra el archivo blacklist.conf:

sudo nano /etc/modprobe.d/blacklist.conf

Agregar contenido:

blacklist nouveau
options nouveau modeset=0

Luego sal y guarda.

Actualizar kernel:

sudo update-initramfs -u

Reanudar:

sudo reboot
(2) Desinstalar el controlador nuevo

Tenga en cuenta que con el paso de eliminación, puede resultar redundante desactivar el nouveau anterior. No lo verifiqué. Lo que registré es la operación real.

Preste especial atención a algunos artículos que dicen que necesita agregar fuentes, reducir la versión de gcc, eliminar el controlador nvidia primero y actualizar en cada momento. ¡No lo intente a ciegas!

Para desinstalar nouveau, use el comando

apt-get --purge remove xserver-xorg-video-nouveau
2.2.3: Instalar el controlador Nvidia

Utilice el comando para comprobar

ubuntu-drivers devices

Probablemente algo como esto

luego instalar

ubuntu-drivers autoinstall

Sí, así lo instalé.

luego reinicia

reboot

Después de reiniciar, inicie sesión y podrá ver el escritorio normalmente.

y entrar

nvidia-smi

También se muestra contenido.

(La imagen de arriba fue tomada después de instalar CUDA Toolkit. La versión CUDA original mostrada no era 12.2)

3. Instale el kit de herramientas CUDA

Aquí, me gustaría recordarles a todos que no prueben los blogs en línea fácilmente y que echen un vistazo detenidamente al sitio web oficial de Nvidia. !

Paso 1: ingrese a la página de descarga de CUDA

Descargas de CUDA Toolkit 12.2 Actualización 2 | Desarrollador NVIDIA

Paso 2: según la situación real, elija cuidadosamente según las opciones de la página

Los siguientes comandos se ejecutan secuencialmente.

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda-repo-ubuntu2004-12-2-local_12.2.2-535.104.05-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-12-2-local_12.2.2-535.104.05-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2004-12-2-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda

Ejecute los comandos uno por uno, tenga paciencia, el CUDA Toolkit supera los 2 G de tamaño

Una vez completada la ejecución, puedes probarlo con nvcc.

nvcc -V

El resultado es comando no encontrado, no te preocupes, hay un paso más.

Paso 3: agregue la ruta cuda a .bashrc

Ejecución (principalmente, el punto decimal está delante del nombre del archivo, no delante de /)

sudo gedit ~/.bashrc

Luego agrega al final

export LD_LIBRARY_PATH=/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin

Guardar documento y salir

Entonces actualízalo

source ~/.bashrc

Luego use nvcc para verificar nuevamente.

nvcc -V

En este momento reinicié con cautela la computadora.

reboot

Una vez completada la instalación, ejecute nvidia-smi y encontrará que la versión CUDA también se ha actualizado. La captura de pantalla es la captura de pantalla que tomé después de ejecutar nvidia-smi arriba. Déjame explicarte nuevamente, esa es la captura de pantalla después de instalar CUDA. No hubo captura de pantalla cuando solo se instaló el controlador.

4. Instale Anaconda y Pytorch

Paso 1: vaya al sitio web oficial de Andaconda para descargar el archivo de instalación

Sitio web: Descarga gratuita | Anaconda

El archivo que descargué es Anaconda3-2023.07-2-Linux-x86_64.sh, que pesa más de 1,1G.

Paso 2: ejecutar el archivo .sh
bash ./Anaconda3-2023.07-2-Linux-x86_64.sh
Paso 3: crear un entorno

Después de instalar Anaconda, creé un entorno con python=3.7 llamado py37:

conda create -n py37 python=3.7 

Entonces activa este entorno.

conda activate py37
Paso 4: instale Pytorch

Como dije antes, no pruebes los blogs en línea fácilmente, mira más en el sitio web oficial. Aquí tienes que ir a la web oficial de Pytorch.

Ingrese la URL: PyTorch

Elija según la situación real, mi elección es la siguiente:

Observe que hay un comando al final. Recuerde ejecutar este comando en el entorno py37 ahora mismo:

conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

Entonces espera pacientemente, en realidad es bastante rápido.

Paso 5: use Pytorch para verificar si CUDA es válido.

Escribir un archivo Python

import torch
print(torch.__version__)
print(torch.cuda.is_available())

Guardamos este archivo como test.py y lo ejecutamos en el entorno py37 ahora mismo:

python test.py

El resultado final es

(py37) howard@howard-ubuntu : ~/Desktop/work-python $ python test.py 
1.13.1
Verdadero

Esto muestra que Pytorch puede reconocer el CUDA recién instalado.

Posdata: Después de instalar Anaconda en Ubuntu, ingresará automáticamente al entorno base cada vez que abras la terminal ¿Cómo deshabilitarlo?

Agregue una oración al archivo ~/.bashrc

configuración de conda --set auto_activate_base falso

En este punto, el texto completo está completo.

Este artículo se refiere a los siguientes artículos, gracias.

1)Cómo instalar los controladores NVIDIA en Ubuntu 20.04 LTS (Focal Fossa) | CiberITHub

2) Instalación del controlador Ubuntu 20.04 NVIDIA GTX1080Ti - Blog de TimZhong

3) ubuntu | Instalar el controlador de gráficos y CUDA | Blog de Rhino

Supongo que te gusta

Origin blog.csdn.net/H_O_W_E/article/details/132713653
Recomendado
Clasificación