El problema de que los programas de aprendizaje profundo no pueden llamar a la GPU cuando se ejecutan en Windows 10 (resuelto)

Es realmente difícil describir cómo ejecutar el aprendizaje profundo en Win10, pero estoy acostumbrado a usar sistemas Windows. He usado sistemas Ubuntu en el pasado y realmente no estoy acostumbrado a escribir documentos en ellos, por lo que es común Mis propios proyectos experimentales utilizan principalmente Win10 como herramienta principal.pycharm+anaconda+win10

Yo uso keras2.3.1. Después de cambiar algunos códigos en el programa, el modelo se interrumpirá cada vez que lo ejecute.

Regístrelo para evitar que se vuelvan a olvidar problemas similares. . .

Así es como se ve cada vez que se abre el administrador de tareas cuando se ejecuta el programa. . . . . .

La gpu no tiene ninguna salida. . . . Creo que eres al menos un 980Ti, si no aportas nada, ¿de qué te sirve? . . .

Ingrese python en la terminal de pycharm para ingresar al entorno de Python

Ingrese el siguiente código en Python

from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())

encontrado en la terminal

 

 Problema encontrado, gpu no detectada

Sólo una CPU (-1)

Después de mi investigación y análisis de investigación, puede haber muchos problemas (Historia de sangre y lágrimas)

 1. La versión de tensorflow no corresponde a la versión de la tarjeta gráfica (o la versión de gpu correspondiente no está instalada)

 

2. cudnn no corresponde a cuda y la versión de python correspondiente y la versión de tensorflow o keras correspondiente

La solución a 1 y 2 es muy simple, simplemente busque la versión correspondiente y reinstálela. Hay muchos tutoriales en línea, algunos de los cuales usan código para cargar en el terminal y otros descargan archivos del sitio web oficial de NVIDIA e instálelos. Todos estos métodos son aceptables.

También puedes intentar reinstalar el controlador de la tarjeta gráfica o actualizar el controlador de la tarjeta gráfica, pero mi problema no está aquí, así que no entraré en detalles, pero aún debes intentarlo.

3. El código no llama a la GPU.

Intente ingresar el siguiente código al principio del programa en ejecución

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0"	#使用的gpu的编号,使用第 0 个

Pero obviamente mi GPU no puede reconocerlo y el problema no está aquí.

4. El entorno bajo anaconda no se ingresa en pycharm.

Este es mi problema

El entorno creado bajo conda ingresa a la configuración de archivo en pycharm

Seleccionar intérprete en el proyecto 

En el intérprete de Python a la derecha, seleccione el entorno conda requerido 

pero

pero

Para mi computadora, pycharm, no ingresó a este entorno virtual. Todavía no sé por qué. La misma configuración se puede usar en otras computadoras. . . .

Por ejemplo, ingrese en la terminal pycharm

conda info --envs

encontrará

Mi programa todavía se encuentra en el entorno base de pycharm. en lugar de en el entorno virtual creado 

https://zhuanlan.zhihu.com/p/441469719

Después de usar el método anterior

Esto se considera entrada (en mi opinión personal). 

5. Falta de componentes CUDA necesarios (personalmente creo que puede ser un error en el programa en ejecución win10, que también es el problema principal que aún no he encontrado)

En el pasado, siempre había más o menos indicaciones de que faltaba un determinado componente de cudnn, pero no presté atención, me concentré en resolver problemas ambientales, y una vez resueltos los problemas ambientales, no hubo indicaciones similares.

De nuevo cuando creo que finalmente lo entendí.

from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())

resultado

Todavía no puedo reconocerlo. . . . . . (Por favor, ignore los errores estúpidos que cometí varias veces cuando escribí el código incorrecto...)

A juzgar por el registro de investigación que escribí en ese momento a continuación, no estaba de buen humor.

Sin embargo, el trabajo duro dio sus frutos y las personas dedicadas encontraron el problema.

No se pudo localizar zlibwapi.dll. Asegúrese de que esté en la ruta de su biblioteca.

Descargue los componentes necesarios del sitio web oficial y agréguelos a la ruta

Dirección del sitio web oficial

https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#install-zlib-windows

 Agregar a la ruta o agregar a cuda

Haga clic derecho en esta computadora----Propiedades----Configuración avanzada del sistema

 

 Variable de entorno ------ruta--------agregar

Agregue la ruta zlibwaip.dll después de descomprimir zlib123.dll.zip a la ruta

vuelva a intentarlo

 Puedes encontrar dos cartas -1 y 0.

Se pueden reconocer tanto la CPU como la GPU.

resuelto. . . . esparcir flores

En resumen, si tienes la capacidad, además de leer materiales en chino, puedes buscar en Google y consultar la información en algunos foros en inglés o sitios web oficiales, si usas otro idioma tendrás más ideas a las que referirte.

 

 

 

 

Supongo que te gusta

Origin blog.csdn.net/qq_44104483/article/details/125521779
Recomendado
Clasificación