Práctica de dibujo con IA (5): amplía y repara fotos antiguas, fotos en mosaico, fotos de carné | Stable Diffusion se convierte en una herramienta de productividad para diseñadores

S: ¿Instalaste difusión estable solo para ver a la joven?
I: Por supuesto que no, por supuesto que es para el desarrollo de la empresa encontrar una salida~~


Aprende de antemano :

¿Puede la difusión estable ser solo señoritas? No, hoy restauramos fotos antiguas con difusión estable.

La imagen original es una foto escaneada:
inserte la descripción de la imagen aquí

Por lo general, solemos usar la restauración de alta definición para ampliar la imagen cuando creamos imágenes, entonces, ¿deberíamos usar el modo de creación de imágenes para fotos antiguas existentes? Sí, pero se usa en este artículo 附加功能, y también se recomienda que use esta función tanto como sea posible al hacer zoom en las fotos. No solo ahorra memoria de video, sino que, lo que es más importante, ¡es rápido!

1. Funciones adicionales

Seleccione fotos antiguas y colóquelas en el área de imágenes con funciones adicionales.
inserte la descripción de la imagen aquí

2. Configuración de parámetros

nombre del parámetro Introducción de funciones Introducción o referencia de estudio
Mejorador1 Ampliar la imagen con el Algoritmo 1 Lanczos/Nearest/BSRGAN/ESRGAN_4x/LDSR/R-ESRGAN 4x+/R-ESRGAN 4x+ Anime6B/ScuNET/ScuNET PSNR/SwinIR 4x
Mejorador2 Ampliar la imagen con el Algoritmo 2 Puede elegir un algoritmo ligeramente borroso, para que las imágenes generadas sean más naturales, no muy AI
Visibilidad del escalador 2 El peso del Algoritmo 2 en relación con el Algoritmo 1 al ampliar la imagen 0 significa que no hay algoritmo 2, 1 significa completo
Visibilidad de GFPGAN Función de reparación facial ¡Artefacto! Módulo de restauración de rostros para fotos antiguas en Python—GFPGAN
Visibilidad de CodeFormer Función de reparación de mosaico CodeFormer: ¡El artefacto de eliminación de mosaicos de IA más fuerte en la superficie! (con tutorial práctico)
Pesos de CodeFormer Cuando es 0, el efecto es el mayor, y cuando es 1, el efecto es el menor

1. Mejorador

Diferentes algoritmos producen diferentes resultados.

inserte la descripción de la imagen aquí

  1. La amplificación pura sin parámetros
    inserte la descripción de la imagen aquí
    en realidad no tiene ningún efecto~~jaja

  2. Lanczos
    inserte la descripción de la imagen aquí
    mantener el ruido

  3. El más cercano
    inserte la descripción de la imagen aquí
    mantiene el ruido, el ruido es un poco más agudo

  4. El ruido BSRGAN
    inserte la descripción de la imagen aquí
    se ha ido, los personajes son relativamente planos y la imagen se agudiza hasta cierto punto.

  5. ESRGAN_4x
    inserte la descripción de la imagen aquí
    tiene ruido evidente, distribución de líneas verticales, contraste más débil, imagen rojiza

  6. El ruido de LDSR
    inserte la descripción de la imagen aquí
    es obvio, el ruido es más grueso y el contraste entre la luz y la oscuridad de la cara es ligeramente más alto que el parámetro anterior.
    Al usar LDSR, es posible que le indique que el certificado SSL es incorrecto. Consulte este artículo para modificar el código: " Se encontraron varios problemas y puntos de conocimiento cuando Windows usa Stable Diffusion (actualización...) "

  7. R-ESRGAN 4x+
    inserte la descripción de la imagen aquí
    se siente muy AI, con líneas claras y nitidez obvia

  8. R-ESRGAN 4x+Anime6B
    inserte la descripción de la imagen aquí
    woodblock AI, las líneas son más claras, la nitidez es demasiado obvia

  9. ScuNET
    inserte la descripción de la imagen aquí
    sin ruido, con efecto de desenfoque

  10. ScuNET PSNR
    inserte la descripción de la imagen aquí
    no tiene ruido, efecto de desenfoque y el contraste es ligeramente superior al parámetro anterior.

  11. SwinIR_4x
    inserte la descripción de la imagen aquí
    no tiene ruido, los caracteres son claros, los bordes de los bloques de color están ligeramente afilados y hay ojos rojos

2. GFPGAN para restauración facial

Un tipo de restauración más integrada con la imagen original y el entorno, poco autoevaluada.
inserte la descripción de la imagen aquí

Sin otros parámetros, el tamaño de la foto no cambiará.

  1. Valor: 0.2
    inserte la descripción de la imagen aquí
    El efecto no es obvio, los ojos son un poco más obvios

  2. Valor: 0.5
    inserte la descripción de la imagen aquí
    Además de ojos claros, el rostro es más detallado

  3. Valor: 1
    inserte la descripción de la imagen aquí
    Toda la cara es muy clara, en marcado contraste con el resto del mosaico.

3. CodeFormer para restauración facial

Tiene el efecto de eliminar el ruido y el mosaico, pero agregará "autoconciencia" al aumentar el peso, y es posible que la cara no coincida con la imagen original.
inserte la descripción de la imagen aquí

Sin otros parámetros, el tamaño de la foto no cambiará.

  1. Valor: 0.2
    inserte la descripción de la imagen aquí
    El ruido de la cara parece ser un poco menor

  2. Valor: 0.5
    inserte la descripción de la imagen aquí
    El ruido de la cara casi desaparece, y la transición entre la cara y el entorno es más suave

  3. Valor: 1
    inserte la descripción de la imagen aquí
    La cara es clara, pero también se vuelve diferente de la cara original, agregando la propia imaginación de AI ~~

3. Dibujo completo

(ScuNET) Ampliación de desenfoque -> (BSRGAN) Nitidez de bordes -> (GFPGAN) reparación de la cara un poco, pero no excesiva -> (CodeFormer) haga correcciones y envíe la imagen para compararla con la imagen
inserte la descripción de la imagen aquí
original
inserte la descripción de la imagen aquí
:
inserte la descripción de la imagen aquí

Siempre que la visibilidad de GFPGAN y CodeFormer no exceda aproximadamente 0,35, los resultados son generalmente similares y la transición es más suave.
Preservar el ruido, desenfoque, nitidez, etc. son todos estilos, y puede establecer parámetros de acuerdo con las necesidades reales.

Finalmente, ¿ya leíste este contenido? Práctica de dibujo de IA (4): imágenes relacionadas png e ícono ícono utilizado para hacer PPT de seguridad alimentaria | Stable Diffusion se convierte en una herramienta de productividad para diseñadores

Supongo que te gusta

Origin blog.csdn.net/snans/article/details/130122766
Recomendado
Clasificación