Uso de cuda cudnn cudatookit y pytorch en el sistema ubuntu

1. Conceptos básicos

Tarjeta gráfica discreta nvidia 1.1

La tarjeta gráfica discreta se refiere a una tarjeta gráfica que existe en forma de tarjeta de placa independiente y se puede conectar y desconectar libremente en una placa base con una interfaz de tarjeta gráfica. La tarjeta gráfica discreta tiene memoria de video independiente, no ocupa la memoria del sistema y está técnicamente por delante de la tarjeta gráfica integrada, que puede proporcionar un mejor efecto de visualización y rendimiento operativo. Como una parte importante del host de la computadora, la tarjeta gráfica es muy importante para aquellos a quienes les gusta jugar y participar en el diseño gráfico profesional. En el pasado, los proveedores de chips gráficos para tarjetas gráficas civiles incluían principalmente a ATI y NVIDIA.

Ubuntu necesita instalar el controlador nvidia para usar nvidia. La instalación del controlador nvidia puede permitir que el sistema identifique correctamente la tarjeta gráfica nvidia, realice la representación 2D/3D y reproduzca el rendimiento adecuado de la tarjeta gráfica.

1.2 CUDA

        CUDA (Arquitectura de dispositivo unificado de computación) es una plataforma informática lanzada por el fabricante de tarjetas gráficas NVIDIA . CUDA™ es una arquitectura informática paralela de propósito general presentada por NVIDIA que permite que las GPU resuelvan problemas informáticos complejos.

Una computadora puede tener dos API CUDA, una es CUDA de controlador (para pantalla de visualización), la otra es CUDA de tiempo de ejecución (aprendizaje profundo acelerado)

Después de instalar el controlador de nvidia, ingrese nvidia-smi en la terminal y aparecerá la siguiente interfaz, en la que la versión de CUDA es 11.4, y el CUDA aquí es dirverCUDA. Es decir, ahora hay CUDA en la computadora, pero solo se usa para la pantalla de visualización, por lo que no puede acelerarse mediante el aprendizaje profundo. Luego, si desea acelerar el aprendizaje profundo, debe instalar CUDA en tiempo de ejecución. Hay dos formas, una es instalar en el entorno conda y la otra es instalar cudatoolkit, que se explicará en detalle más adelante.

1.3 Juego de herramientas CUDA (nvidia)

  CUDA Toolkit (nvidia) es  un paquete completo de instalación de herramientas para CUDA, que brinda opciones de instalación, como controladores Nvidia y kits de herramientas de desarrollo relacionados con el desarrollo de programas CUDA. Incluyendo el compilador de programas CUDA, IDE, depurador, etc., varios archivos de biblioteca correspondientes a programas CUDA y sus archivos de encabezado. En pocas palabras, CUDA Toolkit incluye dirver CUDA y runtimeCUDA.

Por lo tanto, instalar CUDA en ubuntu en un sentido general es en realidad instalar CUDA Toolkit, pero generalmente primero instalaremos el controlador de la tarjeta gráfica nvidia (con dirverCUDA), por lo que al instalar CUDA Toolkit, se eliminará la X delante del controlador, que Es decir, no se instalará, porque ya hay un controlador CUDA en la computadora.

Como se puede ver en la figura anterior, un kit de herramientas cuda completo incluye

  1. Controlador: controlador de tarjeta gráfica

  1. Kit de herramientas : proporciona algunas herramientas como generador de perfiles, depuradores y bibliotecas científicas y bibliotecas de utilidades.

  • cudart : tiempo de ejecución de CUDA

  • cudadevrt : tiempo de ejecución del dispositivo CUDA

  • cupti : interfaz de herramientas de perfilado CUDA ion

  • nvml : biblioteca de administración de NVIDIA

  • nvrtc : compilación del tiempo de ejecución de CUDA

  • cublas : BLAS (Subprogramas de álgebra lineal básica, ensamblaje de álgebra lineal básica)

  • cublas_device : interfaz del núcleo BLAS

  1. Ejemplos de CUDA : ejemplos de código que demuestran cómo usar varias API de biblioteca y CUDA.

  1. CUDA documentado

1.4 Juego de herramientas CUDA (Pytorch)

A menudo usamos las siguientes instrucciones para instalar cudatoolkit en el entorno pytorch, aquí lo llamamos CUDA Toolkit (pytorch)


    
    
     
     
  1. conda install pytorch torchvision cudatoolkit=11.3 -c pytorch
  2. pip3 install torch==1.9.1+cu111 torchvision==0.10.1+cu111 torchaudio==0.9.1 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.tuna .tsinghua.edu.cn/simple

Torchvision es un paquete relacionado con la visión por computadora para PyTorch que proporciona herramientas y funciones útiles para ayudarlo a cargar y preprocesar fácilmente conjuntos de datos de imágenes y videos, realizar aumentos de datos, construir y entrenar modelos de redes neuronales profundas y realizar evaluaciones y visualizaciones de modelos, y más. Las funciones principales incluyen

Torchaudio es un paquete de PyTorch relacionado con el procesamiento de señales de audio, que proporciona algunas herramientas y funciones útiles para ayudarlo a cargar y preprocesar fácilmente conjuntos de datos de audio, realizar extracción de características de sonido, construir y entrenar modelos de redes neuronales profundas y realizar evaluación, visualización y análisis de modelos. más. Las funciones principales incluyen

Este es un paquete de instalación de herramientas incompleto para CUDA, que incluye principalmente la biblioteca de vínculos dinámicos de la que depende cuando se utilizan funciones relacionadas con CUDA. Los controladores no se instalarán. La comprensión personal es que solo se instala cuda en tiempo de ejecución. Este método de instalación puede instalar diferentes versiones de cudatoolkit en múltiples entornos de conda para aplicar código de aprendizaje profundo.

1,5 pulgadas

cuDNN es una biblioteca de aceleración de GPU de aprendizaje profundo basada en CUDA. Con ella, los cálculos de aprendizaje profundo se pueden completar en la GPU. Cuando se instala cudatoolkit (pytorch), cuDNN se instalará automáticamente. Al instalar cudatoolkit (nvidia), debe instalar cuDNN usted mismo

1.6 antorcha

Pytorch es un marco de aprendizaje profundo basado en CUDA , por lo que la versión de pytorch debe depender de la versión del kit de herramientas de cuda. Dado que a menudo usamos el código de otras personas, a menudo sentimos que elegimos la versión CUDA de acuerdo con la versión de pytorch.

2. Cómo elegir este montón

2.1 nvcc-V与nvidia-smi

Mucha gente tendrá esta duda, por qué los números de versión de CUDA generados por nvcc -V y nvidia-smi son diferentes, creo que quedará claro después de leer los conceptos básicos anteriores, porque uno muestra CUDA en tiempo de ejecución (para cálculo) y el otro es controlador CUDA (para pantalla), y siempre instalamos los dos por separado en dos instalaciones separadas.

¿Puede eso hacer que muestren la misma versión? La respuesta es sí, solo necesita instalar la versión completa de CUDAtookit (nvidia) para una instalación única, es decir, agregue la X delante del controlador al instalar CUDA Toolkit. Si ha instalado el controlador nvidia antes esto, debe desinstalarlo, de lo contrario, la instalación fallará y fallará.La razón es dos conflictos CUDA del controlador.

¿Cuál es la relación entre las dos versiones? Por lo general, si el controlador de la tarjeta gráfica se instala primero, la versión que muestra nvidia-smi es superior a la de nvcc- V. Al seleccionar el tiempo de ejecución CUDA, debe verificar el modelo de la tarjeta gráfica y la versión requerida de pytorch para determinar No existe una restricción particularmente estricta sobre una versión, es decir, cada entorno de conda en una computadora puede tener diferentes versiones de cuda.

2.2 Acelerar solo el aprendizaje profundo

Si su propósito es usar CUDA solo para acelerar el aprendizaje profundo, el aprendizaje profundo a menudo requiere diferentes versiones de cuda para diferentes códigos. Es inconveniente instalar solo una versión en la computadora con cudatookit (nvidia), por lo que para el aprendizaje profundo, la estrategia de instalación es :

controlador de tarjeta gráfica nvidia + cudatoolkit (pytorch)

No necesita instalar cudatoolkit (nvidia) en su computadora para acelerar el aprendizaje profundo.Si necesita una nueva versión de aceleración cuda, puede crear un entorno conda para la instalación.


    
    
     
     
  1. conda install pytorch torchvision cudatoolkit=11.3 -c pytorch
  2. o
  3. pip3 install torch==1.9.1+cu111 torchvision==0.10.1+cu111 torchaudio==0.9.1 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.tuna .tsinghua.edu.cn/simple
  4. #Usar Conda para instalar PyTorch es más simple y conveniente, mientras que usar pip es más flexible y gratuito.

2.3 Usar todo

Si desea usarlo no solo en pytorch sino también en C ++, debe instalar cudatoolkit (navidia).Los pasos generales son 1. Instalar el controlador nvidia 2. Instalar cudatoolkit (eliminar controlador) 3. Conda instalar cudatoolkit (pytorch)

Esto se puede entender como tener un driverCUDA y múltiples runtimeCUDA en su sistema ubuntu, luego se informará un error al ejecutar el código en el entorno de pytorch, y es fácil de entender que hay múltiples conflictos de runtimeCUDA y se informan errores.

OSError: /home/cxl/anaconda3/envs/yolo/lib/python3.8/site-packages/nvidia/cublas/lib/libcublas.so.11: undefined symbol: cublasLtGetStatusString, version libcublasLt.so.11
    
    
     
     

Entonces, la forma más fácil es comentar la configuración del entorno cuda en bashrc y abrir una nueva terminal para ejecutarlo nuevamente.


    
    
     
     
  1. 1. Abrir bashrc
  2. sudo ejecuta ~/.bashrc
  3. 2. Anotar la configuración del entorno cuda
  4. #exportar RUTA=$RUTA:/usr/local/cuda-11.3/bin
  5. #exportar LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.3/lib64
  6. #exportar RUTA_BIBLIOTECA=$RUTA_BIBLIOTECA:/usr/local/cuda-11.3/lib64
  7. 3.fuente ~/.bashrc

Cuando ejecute otros códigos, restaure la configuración del entorno cuda en bashrc. Podemos entender que cuda en bashrc es cuda global, y cuda en el entorno conda es cuda local.

3. Instalación

3.1 Controlador de gráficos

La instalación del controlador de la tarjeta gráfica se ha escrito claramente en mi blog anterior.

https://blog.csdn.net/HUASHUDEYANJING/article/details/128838393?spm=1001.2014.3001.5502

3.2 juego de herramientas cuda (nvidia)

1. Seleccione cudatoolkit del sitio web oficial de nvidia

https://developer.nvidia.com/cuda-toolkit-archivo

La selección de versión es generalmente más baja que la versión en nvidia-smi, seleccione el paquete de instalación de runfile

2. Instalar cuda

Primero instale algunas dependencias

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
    
    
     
     

instalar cuda


    
    
     
     
  1. wget https://developer.download.nvidia.com/compute/cuda/11.4.4/local_installers/cuda_11.4.4_470.82.01_linux.run
  2. # Si hay una falla en el segmento CUDA (núcleo volcado) generalmente debido a un desbordamiento de pila
  3. ulímite -a
  4. # encontró que el tamaño de la pila es 8192
  5. # Modificar el límite de la pila a infinito
  6. # Luego continúa descargando desde -c error
  7. wget -c https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
  8. --2023-02-21 20:21:22-- https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
  9. ulimit -s ilimitado
  10. sudo sh cuda_11.4.4_470.82.01_linux.run
  11. #若出现Asegúrese de que haya suficiente espacio en /tmp y que el paquete de instalación no esté dañado
  12. #Cree un archivo tmp usted mismo
  13. sudo sh cuda_10.0.130_410.48_linux.run --tmpdir=[TU DIR TMP]
Retire la X del controlador en este paso

3. configurar bashrc


    
    
     
     
  1. 1. Abrir bashrc
  2. sudo ejecuta ~/.bashrc
  3. 2. Agregue la configuración del entorno cuda
  4. exportar RUTA=$RUTA:/usr/local/cuda-11.3/bin
  5. exportar LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.3/lib64
  6. exportar LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda-11.3/lib64
  7. 3.fuente ~/.bashrc

3.3 cudatoolkit (pytorch)

Instalar directamente usando el comando


    
    
     
     
  1. conda crear -n antorcha
  2. conda activar antorcha
  3. conda install pytorch torchvision cudatoolkit=11.3 -c pytorch
  4. #O use pip para instalar con un clic
  5. pip3 install torch==1.9.1+cu111 torchvision==0.10.1+cu111 torchaudio==0.9.1 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.tuna .tsinghua.edu.cn/simple

1. Conceptos básicos

Tarjeta gráfica discreta nvidia 1.1

La tarjeta gráfica discreta se refiere a una tarjeta gráfica que existe en forma de tarjeta de placa independiente y se puede conectar y desconectar libremente en una placa base con una interfaz de tarjeta gráfica. La tarjeta gráfica discreta tiene memoria de video independiente, no ocupa la memoria del sistema y está técnicamente por delante de la tarjeta gráfica integrada, que puede proporcionar un mejor efecto de visualización y rendimiento operativo. Como una parte importante del host de la computadora, la tarjeta gráfica es muy importante para aquellos a quienes les gusta jugar y participar en el diseño gráfico profesional. En el pasado, los proveedores de chips gráficos para tarjetas gráficas civiles incluían principalmente a ATI y NVIDIA.

Ubuntu necesita instalar el controlador nvidia para usar nvidia. La instalación del controlador nvidia puede permitir que el sistema identifique correctamente la tarjeta gráfica nvidia, realice la representación 2D/3D y reproduzca el rendimiento adecuado de la tarjeta gráfica.

1.2 CUDA

        CUDA (Arquitectura de dispositivo unificado de computación) es una plataforma informática lanzada por el fabricante de tarjetas gráficas NVIDIA . CUDA™ es una arquitectura informática paralela de propósito general presentada por NVIDIA que permite que las GPU resuelvan problemas informáticos complejos.

Una computadora puede tener dos API CUDA, una es CUDA de controlador (para pantalla de visualización), la otra es CUDA de tiempo de ejecución (aprendizaje profundo acelerado)

Después de instalar el controlador de nvidia, ingrese nvidia-smi en la terminal y aparecerá la siguiente interfaz, en la que la versión de CUDA es 11.4, y el CUDA aquí es dirverCUDA. Es decir, ahora hay CUDA en la computadora, pero solo se usa para la pantalla de visualización, por lo que no puede acelerarse mediante el aprendizaje profundo. Luego, si desea acelerar el aprendizaje profundo, debe instalar CUDA en tiempo de ejecución. Hay dos formas, una es instalar en el entorno conda y la otra es instalar cudatoolkit, que se explicará en detalle más adelante.

1.3 Juego de herramientas CUDA (nvidia)

  CUDA Toolkit (nvidia) es  un paquete completo de instalación de herramientas para CUDA, que brinda opciones de instalación, como controladores Nvidia y kits de herramientas de desarrollo relacionados con el desarrollo de programas CUDA. Incluyendo el compilador de programas CUDA, IDE, depurador, etc., varios archivos de biblioteca correspondientes a programas CUDA y sus archivos de encabezado. En pocas palabras, CUDA Toolkit incluye dirver CUDA y runtimeCUDA.

Por lo tanto, instalar CUDA en ubuntu en un sentido general es en realidad instalar CUDA Toolkit, pero generalmente primero instalaremos el controlador de la tarjeta gráfica nvidia (con dirverCUDA), por lo que al instalar CUDA Toolkit, se eliminará la X delante del controlador, que Es decir, no se instalará, porque ya hay un controlador CUDA en la computadora.

Como se puede ver en la figura anterior, un kit de herramientas cuda completo incluye

  1. Controlador: controlador de tarjeta gráfica

  1. Kit de herramientas : proporciona algunas herramientas como generador de perfiles, depuradores y bibliotecas científicas y bibliotecas de utilidades.

  • cudart : tiempo de ejecución de CUDA

  • cudadevrt : tiempo de ejecución del dispositivo CUDA

  • cupti : interfaz de herramientas de perfilado CUDA ion

  • nvml : biblioteca de administración de NVIDIA

  • nvrtc : compilación del tiempo de ejecución de CUDA

  • cublas : BLAS (Subprogramas de álgebra lineal básica, ensamblaje de álgebra lineal básica)

  • cublas_device : interfaz del núcleo BLAS

  1. Ejemplos de CUDA : ejemplos de código que demuestran cómo usar varias API de biblioteca y CUDA.

  1. CUDA documentado

1.4 Juego de herramientas CUDA (Pytorch)

A menudo usamos las siguientes instrucciones para instalar cudatoolkit en el entorno pytorch, aquí lo llamamos CUDA Toolkit (pytorch)


    
    
   
   
  1. conda install pytorch torchvision cudatoolkit=11.3 -c pytorch
  2. pip3 install torch==1.9.1+cu111 torchvision==0.10.1+cu111 torchaudio==0.9.1 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.tuna .tsinghua.edu.cn/simple

Torchvision es un paquete relacionado con la visión por computadora para PyTorch que proporciona herramientas y funciones útiles para ayudarlo a cargar y preprocesar fácilmente conjuntos de datos de imágenes y videos, realizar aumentos de datos, construir y entrenar modelos de redes neuronales profundas y realizar evaluaciones y visualizaciones de modelos, y más. Las funciones principales incluyen

Torchaudio es un paquete de PyTorch relacionado con el procesamiento de señales de audio, que proporciona algunas herramientas y funciones útiles para ayudarlo a cargar y preprocesar fácilmente conjuntos de datos de audio, realizar extracción de características de sonido, construir y entrenar modelos de redes neuronales profundas y realizar evaluación, visualización y análisis de modelos. más. Las funciones principales incluyen

Este es un paquete de instalación de herramientas incompleto para CUDA, que incluye principalmente la biblioteca de vínculos dinámicos de la que depende cuando se utilizan funciones relacionadas con CUDA. Los controladores no se instalarán. La comprensión personal es que solo se instala cuda en tiempo de ejecución. Este método de instalación puede instalar diferentes versiones de cudatoolkit en múltiples entornos de conda para aplicar código de aprendizaje profundo.

1,5 pulgadas

cuDNN es una biblioteca de aceleración de GPU de aprendizaje profundo basada en CUDA. Con ella, los cálculos de aprendizaje profundo se pueden completar en la GPU. Cuando se instala cudatoolkit (pytorch), cuDNN se instalará automáticamente. Al instalar cudatoolkit (nvidia), debe instalar cuDNN usted mismo

1.6 antorcha

Pytorch es un marco de aprendizaje profundo basado en CUDA , por lo que la versión de pytorch debe depender de la versión del kit de herramientas de cuda. Dado que a menudo usamos el código de otras personas, a menudo sentimos que elegimos la versión CUDA de acuerdo con la versión de pytorch.

2. Cómo elegir este montón

2.1 nvcc-V与nvidia-smi

Mucha gente tendrá esta duda, por qué los números de versión de CUDA generados por nvcc -V y nvidia-smi son diferentes, creo que quedará claro después de leer los conceptos básicos anteriores, porque uno muestra CUDA en tiempo de ejecución (para cálculo) y el otro es controlador CUDA (para pantalla), y siempre instalamos los dos por separado en dos instalaciones separadas.

¿Puede eso hacer que muestren la misma versión? La respuesta es sí, solo necesita instalar la versión completa de CUDAtookit (nvidia) para una instalación única, es decir, agregue la X delante del controlador al instalar CUDA Toolkit. Si ha instalado el controlador nvidia antes esto, debe desinstalarlo, de lo contrario, la instalación fallará y fallará.La razón es dos conflictos CUDA del controlador.

¿Cuál es la relación entre las dos versiones? Por lo general, si el controlador de la tarjeta gráfica se instala primero, la versión que muestra nvidia-smi es superior a la de nvcc- V. Al seleccionar el tiempo de ejecución CUDA, debe verificar el modelo de la tarjeta gráfica y la versión requerida de pytorch para determinar No existe una restricción particularmente estricta sobre una versión, es decir, cada entorno de conda en una computadora puede tener diferentes versiones de cuda.

2.2 Acelerar solo el aprendizaje profundo

Si su propósito es usar CUDA solo para acelerar el aprendizaje profundo, el aprendizaje profundo a menudo requiere diferentes versiones de cuda para diferentes códigos. Es inconveniente instalar solo una versión en la computadora con cudatookit (nvidia), por lo que para el aprendizaje profundo, la estrategia de instalación es :

controlador de tarjeta gráfica nvidia + cudatoolkit (pytorch)

No necesita instalar cudatoolkit (nvidia) en su computadora para acelerar el aprendizaje profundo.Si necesita una nueva versión de aceleración cuda, puede crear un entorno conda para la instalación.


    
    
   
   
  1. conda install pytorch torchvision cudatoolkit=11.3 -c pytorch
  2. o
  3. pip3 install torch==1.9.1+cu111 torchvision==0.10.1+cu111 torchaudio==0.9.1 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.tuna .tsinghua.edu.cn/simple
  4. #Usar Conda para instalar PyTorch es más simple y conveniente, mientras que usar pip es más flexible y gratuito.

2.3 Usar todo

Si desea usarlo no solo en pytorch sino también en C ++, debe instalar cudatoolkit (navidia).Los pasos generales son 1. Instalar el controlador nvidia 2. Instalar cudatoolkit (eliminar controlador) 3. Conda instalar cudatoolkit (pytorch)

Esto se puede entender como tener un driverCUDA y múltiples runtimeCUDA en su sistema ubuntu, luego se informará un error al ejecutar el código en el entorno de pytorch, y es fácil de entender que hay múltiples conflictos de runtimeCUDA y se informan errores.

OSError: /home/cxl/anaconda3/envs/yolo/lib/python3.8/site-packages/nvidia/cublas/lib/libcublas.so.11: undefined symbol: cublasLtGetStatusString, version libcublasLt.so.11
    
    
   
   

Entonces, la forma más fácil es comentar la configuración del entorno cuda en bashrc y abrir una nueva terminal para ejecutarlo nuevamente.


    
    
   
   
  1. 1. Abrir bashrc
  2. sudo ejecuta ~/.bashrc
  3. 2. Anotar la configuración del entorno cuda
  4. #exportar RUTA=$RUTA:/usr/local/cuda-11.3/bin
  5. #exportar LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.3/lib64
  6. #exportar RUTA_BIBLIOTECA=$RUTA_BIBLIOTECA:/usr/local/cuda-11.3/lib64
  7. 3.fuente ~/.bashrc

Cuando ejecute otros códigos, restaure la configuración del entorno cuda en bashrc. Podemos entender que cuda en bashrc es cuda global, y cuda en el entorno conda es cuda local.

3. Instalación

3.1 Controlador de gráficos

La instalación del controlador de la tarjeta gráfica se ha escrito claramente en mi blog anterior.

https://blog.csdn.net/HUASHUDEYANJING/article/details/128838393?spm=1001.2014.3001.5502

3.2 juego de herramientas cuda (nvidia)

1. Seleccione cudatoolkit del sitio web oficial de nvidia

https://developer.nvidia.com/cuda-toolkit-archivo

La selección de versión es generalmente más baja que la versión en nvidia-smi, seleccione el paquete de instalación de runfile

2. Instalar cuda

Primero instale algunas dependencias

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
    
    
   
   

instalar cuda


    
    
   
   
  1. wget https://developer.download.nvidia.com/compute/cuda/11.4.4/local_installers/cuda_11.4.4_470.82.01_linux.run
  2. # Si hay una falla en el segmento CUDA (núcleo volcado) generalmente debido a un desbordamiento de pila
  3. ulímite -a
  4. # encontró que el tamaño de la pila es 8192
  5. # Modificar el límite de la pila a infinito
  6. # Luego continúa descargando desde -c error
  7. wget -c https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
  8. --2023-02-21 20:21:22-- https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
  9. ulimit -s ilimitado
  10. sudo sh cuda_11.4.4_470.82.01_linux.run
  11. #若出现Asegúrese de que haya suficiente espacio en /tmp y que el paquete de instalación no esté dañado
  12. #Cree un archivo tmp usted mismo
  13. sudo sh cuda_10.0.130_410.48_linux.run --tmpdir=[TU DIR TMP]
Retire la X del controlador en este paso

3. configurar bashrc


    
    
   
   
  1. 1. Abrir bashrc
  2. sudo ejecuta ~/.bashrc
  3. 2. Agregue la configuración del entorno cuda
  4. exportar RUTA=$RUTA:/usr/local/cuda-11.3/bin
  5. exportar LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.3/lib64
  6. exportar LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda-11.3/lib64
  7. 3.fuente ~/.bashrc

3.3 cudatoolkit (pytorch)

Instalar directamente usando el comando


    
    
   
   
  1. conda crear -n antorcha
  2. conda activar antorcha
  3. conda install pytorch torchvision cudatoolkit=11.3 -c pytorch
  4. #O use pip para instalar con un clic
  5. pip3 install torch==1.9.1+cu111 torchvision==0.10.1+cu111 torchaudio==0.9.1 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.tuna .tsinghua.edu.cn/simple

Supongo que te gusta

Origin blog.csdn.net/baoxueyuan/article/details/132228064
Recomendado
Clasificación