S: ¿Instalaste difusión estable solo para ver a la joven?
I: Por supuesto que no, por supuesto que es para el desarrollo de la empresa encontrar una salida~~
Aprende de antemano :
- Referencia de instalación y resolución de problemas: " Instalación de Windows Stable Diffusion WebUI y registros de resolución de problemas ";
- Problemas al ejecutar y usar " Resolver varios problemas encontrados cuando Windows usa Stable Diffusion ";
- Modelo de aplicación y parámetros " Difusión estable Recomendado personalmente Varios modelos, parámetros de configuración, aplicaciones extendidas, etc. Colección ";
- Palabras de solicitud Crear hechizos " Palabras de solicitud de dibujo AI/Hechizos/Afijos/Guía de uso de palabras clave (Manual de operación del diseñador de solicitud de difusión estable) ";
- Diferentes tipos de modelos Descripción de modelos " Análisis de diferentes tipos de modelos StableDiffusion model Models ";
- Dibuje los movimientos de los personajes y los detalles de las manos y los pies " Difusión estable Dibuje con precisión los movimientos de los personajes y los detalles de las manos y los pies (se requiere la extensión de ControlNet) ";
- Comparación de varios estilos y aplicación práctica " Tabla de comparación de estilo de dibujo AI/registros de investigación detallados y resumen de experiencia de muestras de estilo de dibujo ";
¿Puede la difusión estable ser solo señoritas? No, hoy restauramos fotos antiguas con difusión estable.
La imagen original es una foto escaneada:
Por lo general, solemos usar la restauración de alta definición para ampliar la imagen cuando creamos imágenes, entonces, ¿deberíamos usar el modo de creación de imágenes para fotos antiguas existentes? Sí, pero se usa en este artículo 附加功能
, y también se recomienda que use esta función tanto como sea posible al hacer zoom en las fotos. No solo ahorra memoria de video, sino que, lo que es más importante, ¡es rápido!
1. Funciones adicionales
Seleccione fotos antiguas y colóquelas en el área de imágenes con funciones adicionales.
2. Configuración de parámetros
nombre del parámetro | Introducción de funciones | Introducción o referencia de estudio |
---|---|---|
Mejorador1 | Ampliar la imagen con el Algoritmo 1 | Lanczos/Nearest/BSRGAN/ESRGAN_4x/LDSR/R-ESRGAN 4x+/R-ESRGAN 4x+ Anime6B/ScuNET/ScuNET PSNR/SwinIR 4x |
Mejorador2 | Ampliar la imagen con el Algoritmo 2 | Puede elegir un algoritmo ligeramente borroso, para que las imágenes generadas sean más naturales, no muy AI |
Visibilidad del escalador 2 | El peso del Algoritmo 2 en relación con el Algoritmo 1 al ampliar la imagen | 0 significa que no hay algoritmo 2, 1 significa completo |
Visibilidad de GFPGAN | Función de reparación facial | ¡Artefacto! Módulo de restauración de rostros para fotos antiguas en Python—GFPGAN |
Visibilidad de CodeFormer | Función de reparación de mosaico | CodeFormer: ¡El artefacto de eliminación de mosaicos de IA más fuerte en la superficie! (con tutorial práctico) |
Pesos de CodeFormer | Cuando es 0, el efecto es el mayor, y cuando es 1, el efecto es el menor |
1. Mejorador
Diferentes algoritmos producen diferentes resultados.
-
La amplificación pura sin parámetros
en realidad no tiene ningún efecto~~jaja -
Lanczos
mantener el ruido -
El más cercano
mantiene el ruido, el ruido es un poco más agudo -
El ruido BSRGAN
se ha ido, los personajes son relativamente planos y la imagen se agudiza hasta cierto punto. -
ESRGAN_4x
tiene ruido evidente, distribución de líneas verticales, contraste más débil, imagen rojiza -
El ruido de LDSR
es obvio, el ruido es más grueso y el contraste entre la luz y la oscuridad de la cara es ligeramente más alto que el parámetro anterior.
Al usar LDSR, es posible que le indique que el certificado SSL es incorrecto. Consulte este artículo para modificar el código: " Se encontraron varios problemas y puntos de conocimiento cuando Windows usa Stable Diffusion (actualización...) " -
R-ESRGAN 4x+
se siente muy AI, con líneas claras y nitidez obvia -
R-ESRGAN 4x+Anime6B
woodblock AI, las líneas son más claras, la nitidez es demasiado obvia -
ScuNET
sin ruido, con efecto de desenfoque -
ScuNET PSNR
no tiene ruido, efecto de desenfoque y el contraste es ligeramente superior al parámetro anterior. -
SwinIR_4x
no tiene ruido, los caracteres son claros, los bordes de los bloques de color están ligeramente afilados y hay ojos rojos
2. GFPGAN para restauración facial
Un tipo de restauración más integrada con la imagen original y el entorno, poco autoevaluada.
Sin otros parámetros, el tamaño de la foto no cambiará.
-
Valor: 0.2
El efecto no es obvio, los ojos son un poco más obvios -
Valor: 0.5
Además de ojos claros, el rostro es más detallado -
Valor: 1
Toda la cara es muy clara, en marcado contraste con el resto del mosaico.
3. CodeFormer para restauración facial
Tiene el efecto de eliminar el ruido y el mosaico, pero agregará "autoconciencia" al aumentar el peso, y es posible que la cara no coincida con la imagen original.
Sin otros parámetros, el tamaño de la foto no cambiará.
-
Valor: 0.2
El ruido de la cara parece ser un poco menor -
Valor: 0.5
El ruido de la cara casi desaparece, y la transición entre la cara y el entorno es más suave -
Valor: 1
La cara es clara, pero también se vuelve diferente de la cara original, agregando la propia imaginación de AI ~~
3. Dibujo completo
(ScuNET) Ampliación de desenfoque -> (BSRGAN) Nitidez de bordes -> (GFPGAN) reparación de la cara un poco, pero no excesiva -> (CodeFormer) haga correcciones y envíe la imagen para compararla con la imagen
original
:
Siempre que la visibilidad de GFPGAN y CodeFormer no exceda aproximadamente 0,35, los resultados son generalmente similares y la transición es más suave.
Preservar el ruido, desenfoque, nitidez, etc. son todos estilos, y puede establecer parámetros de acuerdo con las necesidades reales.
Finalmente, ¿ya leíste este contenido? Práctica de dibujo de IA (4): imágenes relacionadas png e ícono ícono utilizado para hacer PPT de seguridad alimentaria | Stable Diffusion se convierte en una herramienta de productividad para diseñadores