[Ruimo.com] Tutorial de implementación local de difusión estable

1. Introducción:

Recientemente vi que Stable Diffusion es de código abierto y se dice que es más rápido que Disco Diffusion, así que saqué el proyecto de git e intenté implementarlo localmente. Grabaré y compartiré el proceso ~ Aquí está la introducción oficial del sitio web
: https://stability.ai/blog/stable-diffusion -public-release

2. Requisitos previos necesarios:

  1. Ciencia en Internet. Se necesitan muchos enlaces.
  2. La memoria de video de la tarjeta gráfica debe ser lo suficientemente grande. En cuanto a qué tan grande es, no he visto a nadie decirlo. De todos modos, 3G definitivamente no funcionará.

3. Preparación antes del despliegue:

Aunque la implementación localizada funciona bien, existen algunos requisitos básicos

(1) Necesita una tarjeta gráfica NVIDIA, a partir de GT1060, y una memoria gráfica de 4G o más. (Ya no es necesario empezar en 3080, es más amigable con la gente)

(2) El sistema operativo requiere el sistema win10 o win11.

Para la localización de la plataforma MacOS, consulte "Cómo ejecutar difusión estable en una computadora Mac para realizar pintura con IA".

(3) Memoria de la computadora 16G o superior.

(4) Es mejor saber cómo usar la magia para navegar por Internet; de lo contrario, la red fluctuará, algunas páginas web no se podrán abrir y, a veces, las descargas serán muy lentas.

(5) Sea paciente, pruebe más y busque más. Repetí este tutorial dos veces, por lo que básicamente se resolvieron y escribieron muchos problemas. Así que no te preocupes, funcionará.

La configuración de mi computadora es para su referencia, Win10, I7, NVIDIA GT1050 4G, 16G

Se necesitan entre 20 y 30 segundos para generar una imagen de 20 pasos (si usa una computadora de mayor rendimiento, la velocidad de generación será más rápida).

4. Proyectos utilizados: Proyecto WebUI de difusión estable

Todo el mundo conoce Stable Difusion. Es uno de los programas de dibujo de IA de código abierto más populares y eficaces que se utilizan actualmente. Es una herramienta popular.

Sin embargo, la implementación localizada del proyecto de difusión estable es una interfaz de código puro, que no es tan amigable para los no programadores.

La webui de difusión estable es un proyecto de operación visual basado en el proyecto de difusión estable.

A través de la operación visual de la página web, es más conveniente depurar mensajes y varios parámetros.

Al mismo tiempo, también se agregan muchas funciones, como la función img2img, función adicional de ampliación de imagen, etc.

Insertar descripción de la imagen aquí

 Por lo tanto, el proyecto webui de difusión estable es la primera opción para que muchas personas lo implementen localmente.

Nuestro tutorial toma como ejemplo el proyecto webui de difusión estable.

2. Configuración del entorno informático

1.Instalar miniconda

Esto se utiliza para administrar las versiones de Python y puede realizar el cambio de múltiples versiones de Python.
Dirección de descarga: https://docs.conda.io/en/latest/miniconda.html

Insertar descripción de la imagen aquí

Durante la instalación, simplemente presione la ruta predeterminada a continuación.

2. Abra miniconda con derechos de administrador, ingrese conda -V y aparecerá el número de versión, lo que significa que la instalación es correcta.

Insertar descripción de la imagen aquí

Insertar descripción de la imagen aquí

3. Configure el entorno de descarga del paquete de la biblioteca para acelerar la red (reemplace la dirección del paquete de descarga de la biblioteca con la estación espejo nacional de Tsinghua)

Ejecute lo siguiente

conda config --set show_channel_urls yes

Generar archivo .condarc

Utilice el Bloc de notas para abrir y modificar el archivo .condarc en Mi PC/Esta computadora-unidad C-usuarios-su nombre de cuenta. (Por ejemplo, mi ruta es C:\Users\Administrator).

Copie todo el contenido siguiente en él, sobrescriba el contenido original, presione Ctrl+s para guardar y cierre el archivo.

channels:
 - defaults
show_channel_urls: true
default_channels:
 - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
 - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
 - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
 conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
 msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
 bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
 menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
 pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
 pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
 simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud

Ejecute conda clean -i para borrar el caché de índice y asegurarse de que se utilice la dirección del sitio espejo.

Insertar descripción de la imagen aquí

 4. Cree un entorno de versión Python 3.10.6

Ejecute la siguiente declaración para crear el entorno.

conda create --name lmd python=3.10.6

El sistema puede indicar y/n, ingresar y y presionar Enter.
Si se muestra Listo, ya está.

Se ha creado un nuevo proyecto en su C:\ProgramData\Miniconda3\envs\lmd.

5. Activa el entorno

Escriba conda activar lmd y presione Entrar.

6. Actualice pip y configure la dirección de descarga del paquete de biblioteca predeterminada de pip en el espejo de Tsinghua.

Presione Entrar después de ingresar cada línea, espere hasta que se complete la ejecución, luego ingrese la siguiente línea y luego presione Entrar.

python -m pip install --upgrade pip
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

Si no se informa ningún error, se completa.

7. Instale git para clonar y descargar proyectos de github, como la webui de difusión estable en este trabajo.

Vaya al sitio web oficial de git https://git-scm.com/download/win

Insertar descripción de la imagen aquí

Después de la descarga, se instalará de forma predeterminada, simplemente haga clic en Siguiente.

Busque git cmd en el menú de inicio.
Ábrelo e ingresa el siguiente comando.

git --version

Verifique la versión de git. Si se muestra el número de versión, la instalación se realizó correctamente.

8.Instalar cuda

cuda es un programa dependiente utilizado por las tarjetas gráficas NVIDIA para ejecutar algoritmos, por lo que lo necesitamos.

Abra el sitio web oficial de NVIDIA cuda, https://developer.nvidia.com/cuda-toolkit-archive
(Es posible que alguien aquí no pueda abrir la página web. De lo contrario, utilice Magic para acceder a Internet).

Encontrarás que hay muchas versiones, ¿qué versión deberías descargar?

Insertar descripción de la imagen aquí

 Regrese a la pequeña ventana de miniconda al principio, ingrese nvidia-smi para verificar su versión de cuda

Insertar descripción de la imagen aquí

 Por ejemplo si la mía es la versión 12.1, descargaré el enlace de la 12.1.0

Instalar después de la descarga. Este software es 2G y se puede instalar en otros lugares además de la unidad C. Por ejemplo, unidad D.

Bueno, después de completar este paso, finalmente se completa la configuración básica del entorno de la computadora.

Ahora comencemos oficialmente a trabajar en la difusión estable.

Nota: Si se le solicita este comando nvidia-smi, que no es un comando interno, haga lo siguiente

Coloque esta ruta: C:\Program Files\NVIDIA Corporation\NVIDIA NvDLISR en la variable de entorno.
La ruta a la tarjeta gráfica:

Insertar descripción de la imagen aquí

 Ubicación de la variable de entorno:

Insertar descripción de la imagen aquí

3. Configuración del entorno de difusión estable

1. Descargue el código fuente de difusión estable

Confirme que se muestra la ventana negra de su miniconda (solo piense en estable como lmd)

Insertar descripción de la imagen aquí

 Si no, ingrese D: y presione Enter.

Por supuesto, también puedes colocarlo en el directorio raíz de otros discos que quieras colocar.

No se recomienda colocarlo en la unidad C, porque hay algunos paquetes de modelos en este proyecto, todos los cuales son de varios gigabytes, es fácil que su unidad C esté llena, otros discos con una capacidad de más de 10G lo harán. hacer.

Luego clone el proyecto webui de difusión estable (en lo sucesivo, sd-webui)

Luego ejecuta

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

Tenga en cuenta que la dirección local del clon ahora es el "directorio raíz del proyecto" que se menciona a menudo a continuación. Por ejemplo, el directorio raíz de mi proyecto es D:\stable-diffusion-webui

2. Descargue el modelo de entrenamiento de difusión estable.

Dirección: https://huggingface.co/CompVis/stable-diffusion-v-1-4-original/tree/main

Haga clic en la pestaña de archivos y versiones para descargar el modelo de entrenamiento sd-v1-4.ckpt.

(Debe registrarse y aceptar el acuerdo. Puede descargarlo después de registrarse y aceptar el acuerdo)

Insertar descripción de la imagen aquí

Nota: Este modelo es una biblioteca de modelos básica de elementos de dibujo que se utilizan para la generación posterior de dibujos de IA.

Si deseas utilizar waifuai o novelai más adelante, puedes cambiar el modelo y colocarlo en la carpeta de modelos del proyecto sd-webui.

Ahora usaremos el modelo de difusión estable 1.4 para seguir bajando.

3. Cambiar el nombre del modelo de entrenamiento.

Después de la descarga, cambie el nombre del modelo a model.ckpt y luego colóquelo en el directorio models/stable-diffusion de sd-webui. Por ejemplo, mi ruta es D:\stable-diffusion-webui\models\Stable-diffusion

Insertar descripción de la imagen aquí

4. Instale GFPGAN

Este es un proyecto de código abierto de Tencent, que se puede utilizar para reparar y dibujar caras y reducir los problemas de distorsión y deformación del dibujo de caras por difusión estable Dirección
: https://github.com/TencentARC/GFPGAN
Bajar la página web al archivo Léame. En la sección md, busque el modelo V1.4 y haga clic en el 1.4 azul para descargarlo.
Insertar descripción de la imagen aquí

 Después de la descarga, simplemente colóquelo en el directorio raíz del proyecto sd-webui, por ejemplo, mi directorio raíz es D: \ stable-diffusion-webui.

4. En la pequeña ventana negra de miniconda, prepárese para iniciar y ejecutar el programa de dibujo ai sd-webui.

ingresar

cd stable-diffusion-webui

Vaya al directorio raíz del proyecto.

Recuerde, debe ingresar al directorio raíz del proyecto de sd-webui antes de ejecutar las siguientes instrucciones; de lo contrario, se informará un error.

Luego ejecuta

webui-user.bat

Luego presione Enter y espere a que el sistema comience la ejecución automáticamente.

Hasta que el sistema lo solicite, ejecutándose en la URL local: http://127.0.0.1:7860

Esto significa que puedes comenzar a usar IA oficialmente para dibujar ~

Aviso:

Este paso a menudo puede causar varios errores y requiere paciencia y tiempo para intentarlo varias veces.

No cierres la ventanita negra, aunque no cambie durante unos minutos.

Si se muestra un error de conexión, es posible que deba activar o desactivar Magic Internet y volver a ejecutar el comando webui-user.bat.

Si accidentalmente sale de la ventana negra, haga clic nuevamente: Menú Inicio-Programas-Abra la ventana de miniconda e ingrese

conda activate lmd

E ingrese al directorio raíz del proyecto sd-webui y ejecute

webui-user.bat

4. Comience a pintar y depurar

1. En un navegador (como Google Chrome), abra http://127.0.0.1:7860 (nota, no cierre la ventana negra de la miniconda)

Insertar descripción de la imagen aquí

 2. Ingrese los comandos relevantes en el área de solicitud, como hermoso paisaje, y luego haga clic en generar a la derecha para generar la primera imagen.

Insertar descripción de la imagen aquí

 3. Estado y operaciones generadas

La página web mostrará una barra de progreso y la pequeña ventana negra de la miniconda también mostrará una barra de progreso.

Cuando la barra de progreso esté llena, podrás ver la imagen que generaste.

Si no desea generarlo, puede hacer clic en interrumpir para detener la generación y se devolverán las imágenes que ha generado hasta ahora. (Por ejemplo, si desea generar 10 imágenes y se han generado 3, haga clic en interrumpir y se devolverán 3 imágenes)

Si hace clic en omitir, se omitirá la generación de esta imagen. Por ejemplo, si desea generar 10 imágenes y ahora genera la tercera imagen, haga clic en omitir, la tercera imagen no se generará y se generará la cuarta imagen. directamente, y finalmente se devolverán 9 imágenes.

Insertar descripción de la imagen aquí

 4. Modifique el valor del recuento de lotes y genere varias imágenes a la vez

El valor predeterminado es 1, que genera 1 imagen a la vez.

Se recomienda generar 4 o más imágenes a la vez, para que la probabilidad de obtener imágenes satisfactorias sea mayor. Puede generar hasta 100 imágenes a la vez.

Insertar descripción de la imagen aquí

 Pero cuanto más grande escriba, más tiempo llevará generarlo todo a la vez. Suponiendo que una imagen toma 30 segundos, configurar 10 imágenes significa 300 segundos, 5 minutos, y configurar 100 imágenes significa 3000 segundos, 50 minutos.

Bien, ahora la implementación de la localización está completa y puedes comenzar a jugar felizmente. Deseo que te diviertas ~

Supongo que te gusta

Origin blog.csdn.net/rrmod/article/details/130750432
Recomendado
Clasificación