Escrevi dois artigos teóricos comparativos seguidos - um pensamento da indústria, uma discussão técnica - pode ter dissuadido muitas pessoas que não sabiam a verdade. Vamos dar uma olhada nos dados de fundo, ok...
O fim de semana está chegando, hoje vou compartilhar um artigo leve, apresentando uma ferramenta de ampliação e aprimoramento de imagem AI de código aberto - Upscayl, que é gratuita, altamente madura, fácil de operar e tem efeitos notáveis.
O que é Upscayl?
O Upscayl é uma ferramenta para ampliação de imagens e conclusão de pixels por meio de modelos de IA. É caracterizado por:
Código aberto e gratuito, instalação local;
Operação simples, 4 etapas para fazê-lo. Embora apenas a interface em inglês seja fornecida, acredito que o coelhinho branco também pode começar facilmente;
O efeito de ampliação da imagem é notável, especialmente, suporta imagens de nitidez, e dizem que o efeito é ainda melhor que o Photoshop;
Plataforma cruzada, suporta Windows/macOS e Linux três principais sistemas operacionais;
Suporta processamento em lote de imagens, uma ferramenta de produtividade adequada.
Instruções básicas de operação
O método de operação do Upscayl é muito intuitivo, dividido principalmente em 4 etapas:
Etapa 1: Clique em [SELECIONAR IMAGEM] para selecionar a imagem a ser ampliada (ou seja, a imagem original).
Passo 2: Selecione o tipo de upscaling da imagem em [Select Upscaling Type].
Real-Esrgan: Melhora a clareza da imagem;
RemaCRI: melhora o efeito de imagem;
UltraMix Balanced: Melhora a saturação de cor da imagem;
UltraSharp: Melhore a clareza da imagem e aguce as bordas;
Arte digital: detalhes aprimorados de cores e texturas;
Nitidez da imagem: apenas nitidez;
Aqui, o usuário só precisa selecionar o tipo de ampliação predefinido, o que simplifica muito a dificuldade da operação, mas, correspondentemente, ajustes manuais mais profissionais e detalhados não podem ser executados.
Passo 3: Clique em [SET OUTPUT FOLDER] para selecionar a pasta de exportação. Ele pode ser deixado desmarcado e será salvo no mesmo caminho da imagem original por padrão.
Etapa 4: Clique em [UPSCAYL] para ampliar.
Explicação do efeito de zoom
Exemplo de explicação:
Imagem original: produzida por Midjourney;
Tipo de amplificação: Arte digital, melhora os detalhes de cores e texturas.
Prompt:paisagem:: por Agnes Lawrence Pelton, por Yaoy Kusama, Mosaic, 4-Dimensional, Star Prism, Upscale é uma ferramenta de IA que pode ampliar imagens. --ar 16:9 --v 5.1
Ampliar pela primeira vez:
Tamanho da imagem original: 1115 × 625
Tamanho ampliado: 4460 × 2500
Tempo de zoom: cerca de 3 a 4 minutos
Descrição do efeito:
comparação geral. Superior: Antes de aumentar o zoom; Inferior: Depois de aumentar o zoom. O efeito de melhoria geral na imagem original é significativo e toda a imagem é mais nítida.
Amplie a imagem em 100% para mostrar o contraste de detalhes. Superior: Antes de aumentar o zoom; Inferior: Depois de aumentar o zoom. Os detalhes originais são perdidos, os detalhes de preenchimento são insuficientes e a sensação será falsa.
Segundo zoom:
Tamanho da imagem original: 4460 × 2500
Tamanho ampliado: 17840 × 10000
Tempo de amplificação: extremamente lento, provavelmente necessário, 15min
Efeito de contraste:
Superior esquerdo: antes de ampliar; inferior esquerdo: após o primeiro zoom; direito: após o segundo zoom. Usando um navegador de computador para exibir, o efeito do segundo zoom e do primeiro zoom não é óbvio, mas o tamanho é muito ampliado.
Obviamente, se você escolher diferentes tipos de ampliação, o efeito da imagem de saída final será muito diferente.
Acima: Tipo de ampliação definido como Arte digital, melhorando os detalhes de cores e texturas;
Abaixo: Configure o tipo de zoom para Real-Esrgan para melhorar a nitidez da imagem;
O efeito do Real-Esrgan é muito melhor do que o da Arte Digital, pois não apenas melhora muito a clareza da imagem original, mas também preserva bem os detalhes.
Outros tipos de zoom não são apresentados aqui um por um. Amigos interessados podem querer experimentar por si mesmos.
experiência pessoal
A razão pela qual eu quero encontrar uma ferramenta de ampliação de imagem fácil de usar é porque, como fotógrafo amador, de repente tive uma ideia de "ladrão de galinhas": existe a possibilidade de usar Midjourney Gerar imagens criativas para armazenamento e vendas?
No entanto, o problema real é que, embora o efeito visual das imagens de saída do Midjourney seja legal, a qualidade das imagens não é satisfatória - o terminal do telefone móvel mal pode ser usado, mas o terminal da Web não é bom o suficiente, muito menos cenários comerciais? A chave é resolver, como mudar a imagem pequena para uma imagem maior, garantindo que a qualidade de exibição da imagem não diminua, mas aumente?
Resumindo, a ideia geral é assim:
Quando experimentei o Upscayl pela primeira vez, o tipo de zoom foi definido como Digital Art. Quando vi a saída, senti: com certeza, eu estava pensando demais; depois de experimentar o Real-Esrgan, senti que estava fazendo isso de novo.
O Upscayl é considerado um aplicativo de IA altamente completo. O que é ainda mais louvável é que ele é de código aberto e gratuito. Não é de admirar que muitos sites domésticos de download de software o usem para espalhar vírus maliciosos. Portanto, se você estiver interessado no Upscayl e quiser fazer o download e experimente, certifique-se de clicar no link do site oficial: https://www.upscayl.org/
Artigos Relacionados: #AIGC na Prática
Outras recomendações:
Comunicação de tecnologia é um oceano azul | Comunicação de tecnologia
Entrevista: TC está em todo lugar, mas não percebemos | Tecnologia Comunicação
Desta vez concordaram em "dizer a verdade" | Comunicação
Pare de discutir aqui, você e eu | Tecnologia Comunicação
Um manual para cultivar pacientes com transtorno obsessivo-compulsivo | Tecnologia de comunicação
É como fazer comida japonesa boa com o coração | Divulgação de tecnologia
Velhos teimosos e manuais enfadonhos | Comunicação tecnológica
Mover para Novas Mídias | Comunicação de Tecnologia
Avaliação: Sistema de Ajuda ao Usuário do Glória dos Reis | Tecnologia Comunicação
Rui Qi
comunicador técnico
Planejamento de conteúdo de marca
fotógrafo freelancer
Escritor freelancer
Wang Lidi
Conta pública: techcomm / htstory
Conta do WeChat: bgrichi
E-mail: [email protected]