Compartir 54 herramientas AIGC de nivel tesoro (claude, Midjourney, Stable Diffusion, etc.)

Con el auge de ChatGPT ola tras ola, la IA generativa ha entrado gradualmente en el campo de visión de las personas y se ha vuelto popular, como dice la gente: ¡la IA se usa bien, salga del trabajo temprano todos los días !

Por supuesto, el uso efectivo de la IA no solo puede salir temprano del trabajo, sino también pescar durante las horas de trabajo, al igual que el hermano Pan, jajaja ~~~

El artefacto de IA de Niu X puede ser más que ChatGPT, aunque Pan Ge tiene debilidad por ChatGPT. Hoy, recomendaré 54 artefactos de IA a todos . ¡Con ellos, la eficiencia de su trabajo aumentará N veces nuevamente!

01

Herramientas de chat/escritura

número de serie nombre de la herramienta Dirección del sitio web oficial
1 claudio https://claude.ai
2 Bardo de Google http://bard.google.com
3 Wenxinyiyan https://yiyan.baidu.com/
4 Noción Al https://www.notion.so/product/ai
5 Tongyiqianwen https://tongyi.aliyun.com/
6 Chispa Xunfei https://xinghuo.xfyun.cn/
7 secuencia mono https://openapi.mobvoi.com/index
8 Tencent Wenyong https://effidit.qq.com
9 Buscar frases según su significado https://quierocitas.net/
10 diccionario inverso https://quieropalabras.net/
11 FlowUS https://flowus.cn/producto
12 volcán escribiendo https://www.escritura.net/

Claude
Claude es un producto similar a ChatGPT lanzado por la empresa de inteligencia artificial Anthropic.

Claude es un asistente de inteligencia artificial muy inteligente. Puede comprender sus intenciones y llevar a cabo diversas interacciones a través del lenguaje natural, convirtiéndose así en el socio de IA más eficiente en su vida y trabajo, haciendo que las tareas tediosas y el procesamiento de información compleja sean simples y eficientes.

Muchos entusiastas de AIGC a menudo comparan Claude y ChatGPT. Muchos de ellos creen que ChatGPT es superior en expresión y generación de lenguaje, y actualmente es el chatbot más poderoso disponible públicamente. Sin embargo, como producto comercial, Claude es más maduro en términos de seguridad, memoria a largo plazo y experiencia interactiva, y es adecuado para aplicaciones comerciales prácticas. Desde la perspectiva de la investigación y la tecnología, ChatGPT puede tener más ventajas. Pero desde la perspectiva de los productos y aplicaciones, Claude será más práctico y maduro. Ambos son actualmente los chatbots más avanzados, y vale la pena aprenderlos y consultarlos.

El 12 de julio, Anthropic anunció el lanzamiento del último modelo de lenguaje grande, Claude 2.

El modelo actualizado de Claude 2 ha mejorado el rendimiento en codificación, matemáticas e inferencia. Después de la actualización, la capacidad de procesamiento de Claude 2 se incrementó a 100 000 tokens , lo que significa que puede procesar cientos de páginas (alrededor de 80 000 palabras) de documentos técnicos o incluso libros completos. Además, Claude 2 también ha comenzado a ser gratuito y abierto a un grupo de usuarios más amplio, y es compatible con el uso en chino .

Dirección del sitio web oficial: https://claude.ai

Google Bard
Bard es el gran asesino de Google (Google), el gigante de los motores de búsqueda número 1 del mundo, simplemente ChatGPT.

Bard es un chatbot lanzado por Google basado en un gran modelo de lenguaje. El poder detrás de Bard es el modelo de lenguaje para aplicaciones conversacionales de Google, también conocido como LaMDA. Bard es una versión ligera basada en LaMDA.

En el campo de AIGC, Google debería haberse levantado temprano y alcanzado tarde. Debido a que el marco de AIGC de nivel más bajo fue desarrollado por primera vez por Google, pero Google no lanzó AIGC antes que OpenAI, no se sabe si no quiere revolucionarse a sí mismo o por otras razones. Se informa en Internet que las primeras investigaciones de Google sobre AIGC saltaron a OpenAI, y recientemente hay informes de que estas personas han comenzado a regresar a Google.

El 13 de julio, Google Bard marcó el comienzo de la actualización más grande de la historia: han llegado las capacidades de exportación de archivos, reconocimiento de imágenes y chino .

En términos simples, Bard ahora incorpora el conocimiento de más idiomas, lo que permite un control más granular sobre las respuestas, lo que permite que las respuestas se hablen además del texto serio. En el uso real, también puede ver que ya no siempre responde las preguntas en una oración.

Dirección del sitio web oficial: http://bard.google.com

Wenxinyiyan
Wenxinyiyan de Baidu: ¿Puede competir contra ChatGPT como lo hizo contra Google? Por supuesto, no debe haber anuncios, y no puedes simplemente responder al contenido de alguien después de dar dinero~~~

imagen

Wenxin Yiyan (nombre en inglés: ERNIE Bot) es un robot de chat desarrollado por Baidu. El servicio en la nube de Wenxin Yiyan se lanzará el 27 de marzo. En junio, la versión 3.5 de Baidu Wenxin Large Model estuvo disponible para pruebas internas.

No hace falta decir que si Baidu se compara con Google, el punto de referencia de Wen Xin debe ser ChatGPT . En la era de Internet, Baidu una vez dominó el mundo después de que Google se retirara de China. Eso sí, también es criticado por la "publicidad".

En la era de Internet móvil, Baidu no tomó el "boleto de envío" y guardó silencio sobre la tecnología de conducción no tripulada. Sin embargo, debido a múltiples factores, esta tecnología aún no le ha brindado mayores beneficios a Baidu.

La era Lu Qi de Baidu, porque Lu Qi esperaba ser All in AI, se resignó. Esta vez Baidu regresa con "Wen Xin Yi Yan", en los comentarios de los dos cielos de hielo y fuego, no sé si podrá reproducir su gloria.

Dirección del sitio web oficial: https://yiyan.baidu.com/

Tongyi Qianwen
Tongyi Qianwen es un modelo de lenguaje a gran escala desarrollado de forma independiente por Alibaba Cloud. Sus funciones incluyen múltiples rondas de diálogo, redacción de textos publicitarios, razonamiento lógico, comprensión multimodal y compatibilidad con varios idiomas. Es capaz de interactuar con humanos durante múltiples rondas, y también incorpora comprensión de conocimiento multimodal, y tiene la capacidad de crear redacción publicitaria, y puede continuar escribiendo novelas, escribiendo correos electrónicos, etc. El 18 de abril, DingTalk se unió oficialmente al modelo "Tongyi Qianwen" de Alibaba.

imagen

Ali tiene sus propios genes para el comercio electrónico. ¿Tongyi Qianwen se centrará en las aplicaciones comerciales? Pan Ge piensa que es muy posible.

En el momento en que la participación de mercado de Taobao ha estado disminuyendo repetidamente y Ant Financial Services una vez más fue severamente multado, Ali reestructuró el modelo organizacional corporativo y los nombramientos de personal. No se sabe si puede recuperar la caída a través de Tongyi Qianwen.

Dirección del sitio web oficial: https://tongyi.aliyun.com/

Notion Al
Notion AI, una herramienta de administración y edición de documentos en línea impulsada por IA, una de las herramientas de escritura de inteligencia artificial, se enfoca en el campo de la creación de contenido y es famosa por su eficiencia, conveniencia, aplicación de múltiples campos y operación simple. Conocido como ChatGPT en el campo del documento.

imagen

Notion AI es compatible con chino, inglés, japonés y otros idiomas y colaboraciones entre varias personas, y proporciona una gran cantidad de plantillas y complementos, que se utilizan ampliamente en notas, bases de conocimiento, edición de noticias, gestión de proyectos, registros de reuniones, horarios. y otros escenarios.

Notion AI es un servicio de inteligencia artificial desarrollado por Notion, un unicornio de productividad con sede en Silicon Valley. El lanzamiento inicial se limitó a un pequeño grupo de usuarios que pudieron registrarse previamente para usar el servicio. Sin embargo, en los últimos meses, a medida que más y más usuarios obtuvieron acceso al servicio de IA, el entusiasmo se extendió por la comunidad de usuarios, y muchos lo llamaron una "herramienta poderosa de productividad" y un "impulsor de la eficiencia".

Notion A ofrece una gama de características impulsadas por A, que incluyen lluvia de ideas, blogs, creación de esquemas, administración de redes sociales, redacción de artículos académicos y resúmenes de investigaciones.

Se puede acceder a Notion Al desde la aplicación Notion, y el asistente A aparece automáticamente al crear un nuevo documento o al mantener presionada la barra espaciadora. Luego, el Asistente presenta un menú desplegable para una sola persona con más de diez opciones que cubren una variedad de tareas de escritura, cada una de las cuales ofrece un estilo de escritura, una plantilla, un tono y una funcionalidad ampliada diferentes.

Dirección del sitio web oficial: https://www.notion.so/product/ai

Xunfei Xunfei
Xunfei Xunhuo es una investigación y desarrollo independiente lanzada por HKUST Xunfei el 6 de mayo (desde el código abierto de OpenAI, todos los nuevos modelos grandes lo han dicho, perdone a Pange, está oscuro ~~~) un gran El modelo de lenguaje tiene siete dimensiones de generación de texto, comprensión del lenguaje, preguntas y respuestas de conocimiento, razonamiento lógico, matemáticas, código y multimodalidad. Después de la evaluación y comparación, se encontró que Xunfei Spark se desempeñó mejor que ChatGPT en términos de comprensión del lenguaje y capacidad matemática.

imagen

Xunfei Xinghuo puede completar la generación de texto largo de varios estilos, varios idiomas y varias tareas, y también puede realizar la detección de gramática y la corrección de errores en la redacción de textos publicitarios en inglés, y su capacidad de comprensión del idioma no es inferior a los sistemas existentes que se pueden medir en China.

En ese entonces, Baidu lanzó un eslogan promocional: "Baidu entiende mejor el chino", atacando directamente a Google. No sé si esto es lo que significa Xunfei Xinghuo. ¿Xunfei Xinghuo entiende mejor el chino? ¿Especialmente chino antiguo?

Dirección del sitio web oficial: https://xinghuo.xfyun.cn/

Sequence Monkey
Sequence Monkey es un gran modelo de lenguaje lanzado por la compañía de IA [Ir a preguntar]. El modelo Sequence Monkey es un modelo de lenguaje a gran escala con las características de secuencias largas, multimodalidad, modelo único y big data. Basado en su representación general y capacidades de razonamiento, admite múltiples rondas de interacción y puede mejorar en gran medida la eficiencia de la producción. y capacidades de procesamiento de datos. , es ampliamente utilizado en sistemas de respuesta a preguntas, procesamiento de lenguaje natural, traducción automática, resumen de texto y otros campos.

El fundador de SequenceMonkey es [Li Zhifei], un doctorado del Departamento de Ciencias de la Computación de la Universidad Johns Hopkins, un ex científico de la sede de Google, un experto en procesamiento de lenguaje natural e inteligencia artificial de clase mundial, y el principal desarrollador de Joshua, el principal software de código abierto de traducción automática del mundo.

Dirección del sitio web oficial: https://openapi.mobvoi.com/index

02

/

herramientas de generación de imágenes

Las herramientas AIGC de generación de imágenes generalmente se dividen en tres categorías:

1.
Los productos AIGC de generación de imágenes representados por Midjourney, Stable Diffusion, DALL-E 2, etc., funcionan principalmente para generar imágenes realistas. Este tipo de herramienta de generación de imágenes puede basarse en una descripción de texto (también lo llamamos comando/Indicador) O un boceto puede generar una imagen completa con un estilo específico.Este tipo de herramienta tiene una tecnología subyacente lógica y clara, que puede proporcionar a los creadores de imágenes una muy buena fuente de inspiración creativa y servir como una referencia importante para la creación.

2. Edición de imágenes
La función principal es el procesamiento de imágenes, como la eliminación inteligente de marcas de agua de imágenes, la configuración de filtros de estilo, la modificación del estilo de imagen o la mejora de la claridad de la imagen, etc., representados por productos como Imagen AI y Maker Sticker AI Painter.

3. Modificación parcial de imágenes
Como su nombre indica, la herramienta para la edición y modificación parcial de imágenes está representada por Adobe Firefly. Su principal ventaja se centra en cambiar algunos elementos de la imagen, o modificar y ajustar capa por capa, lo cual es adecuado para la creación secundaria o la mejora de la postproducción.

número de serie nombre de la herramienta Dirección del sitio web oficial
1 a mitad de camino https://www.midjourney.com/
2 Difusión estable https://stablediffusionweb.com/
3 Difusión disco https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
4 DESDE-E 2 https://openai.com/product/dall-e-2
5 IA de imagen https://imagen.research.google
6 luciérnaga de adobe https://www.adobe.com/sensei/generative-ai/firefly.html
7 Estilo literario https://yige.baidu.com/
8 Ali Luban Luban https://luban.aliyun.com/
9 Creador de pegatinas AI Pintor https://aiart.chuangkit.com/show
10 Qianku AI pintura ilimitada https://588ku.com/ai/wuxianhua
11 Texto a Pokémon

pokémon

https://replicate.com/lambdal/text-to-pokemon
12 diario de sueños https://www.printidea.art
13 Caminante IA https://xingzheai.cn


Midjourney
usa texto para crear imágenes, y el efecto visual es explosivo. Recientemente, la fuerza principal de las pantallas de actualización de video cortas, el líder de los chatbots de pintura de IA y las herramientas se llevan a cabo en Discord.
Después del lanzamiento de la versión Midjourney  V5, es aún más impresionante. La fidelidad y el procesamiento de detalles de la imagen son más refinados, y el nivel de comercialización es más alto, que casi ha llegado al nivel de la fotografía, y puede "confundir lo real con lo falso".

imagen

Midjourney ha dejado sin empleo a muchos diseñadores ordinarios y ha brillado en el campo de los negocios, especialmente en el desarrollo de productos.

Dirección del sitio web oficial: https://www.midjourney.com/

Stable Diffusion
Stable Diffusion es un generador de imágenes de IA gratuito y de código abierto con efectos de generación de imágenes a nivel de píxel, y también es brillante con Midjourney por un tiempo.

Los usuarios solo necesitan usar instrucciones descriptivas cortas (palabras rápidas/Mensaje) para generar imágenes, y la estructura del cuerpo humano y el procesamiento de detalles de las imágenes son más realistas y están más en línea con la estética pública, y los retratos generados son más claros y más realistas.

Detrás del efecto de explosión hay un alto umbral de uso.

Dirección del sitio web oficial: https://stablediffusionweb.com/

Disco Diffusion
Disco Diffusion es un programa de dibujo que se ejecuta en Google Colab. Los usuarios con una cuenta de Google pueden ejecutarlo directamente en el navegador. También se puede implementar para ejecutarse localmente, pero requiere que los usuarios tengan cierto conocimiento del código.

Después de que el usuario ingresa una oración de descripción, el programa puede representar y generar automáticamente una imagen de la escena correspondiente. Es mejor para generar imágenes abstractas con un estilo más soñador, y el efecto es promedio cuando genera representaciones realistas e ingresa más descripciones de texto.

Dirección del sitio web oficial:
https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb

DALL-E 2
DALL-E 2 es una herramienta de generación y edición de imágenes lanzada por OpenAI, y también es una obra maestra. Es famoso por su increíble efecto de generación y color artístico, y es conocido como el maestro de la pintura realista. El usuario solo necesita ingresar una breve instrucción (palabra indicadora/Indicador), y DALL-E 2 puede sintetizar los tres elementos de concepto, atributo y estilo para generar una imagen realista que satisfaga las necesidades del estilo de pintura del usuario.

Por ejemplo, si el usuario ingresa los tres elementos del concepto "una ardilla", atributo "en un árbol" y estilo "estilo de artista pop Andy Warhol", DALL-E 2 puede producir imágenes que cumplan con estas tres condiciones, y el efecto es pendiente. Las características de la herramienta también incluyen edición de imágenes, transformación de estilo y más.

Dirección del sitio web oficial: https://openai.com/product/dall-e-2

Adobe Firefly
Cuando se trata de generación de imágenes, ¿cómo puede faltar Adobe? Después de todo, Photoshop es un líder bien merecido en la industria mundial de procesamiento de imágenes.

Firefly, lanzado por Adobe y Nvidia, un gigante de los chips , puede completar perfectamente "Dibujo con IA + edición de fotos". En la actualidad, se han realizado funciones como generar imágenes a partir de texto, convertir bocetos en imágenes y modificar el contenido de la imagen con una sola tecla. También es posible modificar las imágenes generadas automáticamente en capas y generar imágenes de ultra alta resolución. .

Amigos que dominan Photoshop, pueden probarlo~~~

Dirección del sitio web oficial: https://www.adobe.com/sensei/generative-ai/firefly.html

Wenxin Yige
La herramienta de generación de imágenes de Baidu AI Family Bucket, que admite la generación de imágenes a partir de imágenes y la conversión de imágenes a videos.

Wenxin Yige se basa en la paleta voladora y la tecnología de modelo a gran escala de Wenxin. Los usuarios solo necesitan ingresar su propio texto creativo y elegir el estilo de imagen deseado. Wenxin Yige puede generar pinturas. También pueden elegir el tipo de imagen, la relación de imagen, el número de imágenes generadas a la vez, etc. En la actualidad, Wenxin Yige admite más de diez estilos diferentes de imágenes, como pintura al óleo, acuarela, animación y realismo.

Por supuesto, también se ha informado en Internet que Wenxinyige primero traduce las instrucciones al inglés, luego va a xxx y luego genera imágenes.

Dirección del sitio web oficial: https://yige.baidu.com/

Ali Luban Luban
Luban es una herramienta de generación de imágenes desarrollada de forma independiente por Alibaba Group Intelligent Design Laboratory. Basado en la tecnología de generación de imágenes de IA, Luban puede completar el diseño de una gran cantidad de imágenes de pancartas, carteles e imágenes de lugares en poco tiempo.

¡Deberías entenderlo! Sí, Luban parece haber nacido para el comercio electrónico. Los usuarios solo necesitan ingresar el estilo y el tamaño que desean lograr, y Luban puede completar rápidamente proyectos de diseño que consumen mucho tiempo y mano de obra, como análisis de materiales, recortes y combinación de colores, y generar múltiples conjuntos de soluciones de diseño que cumplen con los requisitos. en tiempo real. Los trabajadores del arte ordinarios están básicamente volcados.

Dirección del sitio web oficial: https://luban.aliyun.com/

03

/

Herramientas de generación de audio

Además de los escenarios de aplicación de AIGC, como texto e imágenes mencionados anteriormente, el audio y el video también son escenarios de aplicación con los que muchas personas entrarán en contacto en los campos del trabajo, la vida e incluso el emprendimiento de medios propios.
Por ejemplo, el cambio de voz, la síntesis de voz y la clonación de voz en videos cortos son escenarios de aplicación populares para AIGC de audio. Por supuesto, también incluye animación, películas, doblaje de personajes en juegos, etc. La mayoría de ellos ahora pueden ser manejados fácilmente por IA.

Las herramientas de audio AIGC se pueden dividir en dos tipos según sus atributos funcionales:
1. Las herramientas de procesamiento de música
, representadas por So-Vits-Svc, Adobe Podcast AI Voice, Magic Sound Workshop, etc., utilizan tecnología de inteligencia artificial para reparar y mejorar la calidad del audio. o conversión de timbre, etc.,
2. Las herramientas de producción musical
, representadas principalmente por MusicLM, Netease Tianyin, Aiva, etc., pueden realizar la función de "texto a música" en campos más subdivididos.

número de serie nombre de la herramienta Dirección del sitio web oficial
1 So-Vits-Svc instalar por ti mismo
2

Adobe Podcast Al

Voz

https://podcast.adobe.com/enhance
3 Google Music LM https://google-research.github.io/seanet/musiclm/examples
4 Xunfei escuchó https://wwwiflyrec.com/
5 NetEase Tianyin https://tianyin.music.163.com/
6 Taller de sonido mágico https://www.moyin.com/
7 Falso que https://fakeyou.com
8 Estudio Lírico https://lyricstudio.net
9 LALAL.AI https://www.lalal.ai
10 Murf https://murf.ai/
11 Se parecen a la IA https://www.parecer.ai/
12 Él era https://www.aiva.ai

So-Vits-Svc
So-Vits-Svc就是全网最火的模仿“孙燕姿”的背后AI。

So-Vits-Svc这款模型使用SoftVC内容编码器来提取真人歌手的源音频的语音特征,然后把它传进VITS语音合成模型中去,让歌手原声被保留下来。类似的“AI歌手”还有AI周杰伦、AI许嵩、AI王心凌等。

除了模拟知名的歌手嗓音之外,So-Vits-Svc还能基于电话录音、录像视频等素材来模拟大量真人声音。很多人也用这个工具做偏门。



Adobe podcast
可以在线一键增强语音,可以说是专业播客音频处理工具。

该工具也是由Adobe公司推出,由AI驱动的音频增强器,能利用AI来提高博客音频录制的质量。

用户在登录Adobe账号之后,上传好需要进行降噪处理的音频文件,AI便会自动处理音频文件,达到满意的音频播放效果之后,用户就能直接下载到电脑上自由使用

官网地址:https://podcast.adobe.com/

MusicLM
谷歌AI全家桶成员,会唱歌的AI模型。
MusicLM是Google发布的一款全真生成式AI模型,通过该模型,可以由文字直接生成高保真度的音乐。除了文字之外,无论是哼唱、演唱、敲击、乐器演奏等,MusicLM都可以在这些既有旋律上创建音乐,并能够确保音乐不失真。

MusicLM最大的亮点就在于,它可以根据一到两个提示词(Prompt)就能生成一段5分钟的完整曲目。而且,风格多样,包括电子乐、爵士乐、蓝调、Pop等都不在话下。歌曲长度也可提前设定好,可以是一首5分钟的曲目,也可以是一个十几秒的哼唱小片段。

MusicLM还能生成由特定乐器演奏的曲段,而且,超牛的是,你可以自己设定演奏者的演奏水平,还能根据时代特色、演奏地点等创作音乐。比如可以给出指令:“具有80年代风格的、由管风琴在山巅演奏的流行音乐”等等。

官网地址:https://google-research.github.io/seanet/musiclm/examples/

讯飞听见
讯飞听见是科大讯飞旗下的另一款AIGC产品,功能是随时随地语音转文字。作为一款智能语音产品,讯飞听见依托于科大讯飞的自然语言处理、声纹识别和语音识别等语音技术,讯飞听见可满足用户在多种场景下的语音需求,适用场景涵盖会议记录、授课演讲、媒体访谈、个人写作等不同场合。

讯飞听见的优势还有,它可以为视频添加双语字幕,也可以做多语种同传翻译,还包括为视频会议生成字幕等。嗯,支持国产音频AIGC,可以考虑深度研究一下讯飞听见。

网易天音
可以实现一站式AI音乐创作的好工具。老互联网人都知道,网易在产品打磨上还是有一套的,其旗下产品虽不惊世骇俗,但也都非常受用户喜欢。

网易天音主要功能是进行AI音乐在线创作,它的最大优势在于音乐创作门槛低,用户能在短时间内根据指引完成一首原创音乐的编曲。

网易天音的工作台中包括了非常多且具体的音乐风格,比如流行、民谣、国风等等,支持用户从零开始创作一组自己的和弦,也支持将预设好的和弦拖进编辑段落当中,对全曲进行增减、复制、调整段落等编辑,全部编辑完成后会进行自动渲染,稍微等待就能得到一首自己创作的原创编曲。

顺便推荐一下网易创始人丁磊出的一本AI的书籍,相当不错。

官网地址:https://tianyin.music.163.com/

魔音工坊
魔音工坊对于做短视频赛道的伙伴来说,应该不陌生,尤其是对影视解说的大V来说,是他们必备的利器。

魔音工由北京小问智能科技有限公司开发的一款配音软件,为用户提供一站式AI配音服务。该平台的数字人,在当下也是非常好的应用。

应用魔音工坊的用户,能够非常容易的用它模拟出具有个人特色的真人语音,进行AI音频内容创作,让文字一键转换为真人语音。

Fake You
FakeYou是一个使用深度伪造技术生成不同语言和声音的文本到语音的音频剪辑工具,使用者可以使用任意人物角色的声音来创建音频,工具还提供了文本转语音功能,被誉为伪造声音的利器。

当用户输入一段想要生成的文字并选择好想要谁来念出这段文字,再点击“说话”按键,一段由目标人物“说”出的语音就自动生成出来了。目前,该工具也被广泛应用在短视频创作中。比如用名人图片制作他的数字人,并用FakeYou来实现这个名人的声音,从而做成一个短视频。如果有时间,潘哥可以拆解一下这个短视频制作的全流程。

官网地址:https://fakeyou.com/

图片生成数字人的方法可以参考:
拆解最近爆火的“禅语”小和尚视频——AI制作方法揭秘

04

视频生成类工具

文生视频,应该也是接下来AIGC领域一个竞争极其激烈的一个赛道,互联网就是这么个路径发展而来的,由最初的文字、到图片、到音频在到现在的视频,AIGC路径也是如此。

序号 工具名称 官网地址9
1 D-ID https://www.d-id.com/
2 Runway https://runwayml.com/
3 Visla https://www.visla.us/
4 Deepfakes
5 Runway Gen-2 https://research.runwayml.com/gen2
6 Make-A-Video https://makeavideo.studio
7 商汤智影 https://www.sensetime.com/cn/product-index
8 Decoherence https://www.decoherence.co
9 一帧秒创 https://aigc.yizhentv.com
10 FILM https://replicate.com/google-research/frame-interpolation
11 Opus https://opus.ai/
12 Pictory https://pictory.ai/
13 Videoleap https://www.videoleapapp.com
14 KreadoAl https://www.kreadoai.com
15 Re:memory https://rememory.deepbrain.io
16

Deepbrain

https://www.deepbrain.io/aistudios
17 OASIS https://theoasis.com


D-ID
文字转视频,虚拟数字人的超强AIGC工具,很多人接触视频类AI工具都是先从D-ID开始的。

D-ID全称是de-identification,主要是人脸去识别化技术服务。简单点讲,短视频中,可以创造个虚拟化讲解员,在视频中代替真人出镜,介绍视频内容。

用户只需择自己想要的虚拟人形象,可以直接使用官方提供的丰富形象库,或者上传自己的人物照片。然后,在右侧文本框中输入你想让人物说的内容,或者上传本地的音频。D-ID内置了GPT模型,可以对你的文本进行润色。接下来,选择对应的语言、配音的声音和语调。点击生成视频,几分钟后,你就可以下载到制作完成的视频了。

官网地址:https://www.d-id.com/

Runway Gen-2
Gen-2是Runway推出的一款从端到端的Transformer模型,用户能以图片和文字为条件,从零开始生成一个原创的慢风格视频,30秒就可以生成电影大片。

Gen-2所生成的视频分辨率高达1280×720,时长约为30-60秒,目前可以实现以下几种功能:生成视频、生成图像、根据文字提示无限制扩展图像、混合图像风格、训练AI模型、删除视频中的某个元素、扣除背景等。

Gen-2是通过文字生成视频,完全是从无到有,可以说是最前沿的AI视频技术了。

官网地址:https://research.runwayml.com/gen2

DeepFakes
DeepFakes(深度伪造)是一种合成媒体,它利用强大的人工智能(AI)和机器学习(ML)技术来生成极其逼真的虚假视觉和音频内容,从而使人类很难将其与原始内容区分开来。除了对DeepFakes概念的技术介绍外,该书还详细介绍了检测DeepFakes的算法、识别篡改内容和识别换脸的技术、生成对抗神经网络、媒体取证技术、深度学习架构、DeepFakes的取证分析等。

超强的变脸、换脸技术,让Deepfakes如今成为了AI合成视频的代名词。

Make-A-Video
文本直接转视频的超级好用的AIGC工具。由Meta推出,我们只需输入几个简单的单词描述之后,该工具就会制作出一段无声的视频出来。

此外,基于“文生图”技术之上,Make-A-Video还能将静态的图片动画化。

Afirmaciones de Make-A-Video: el modelo está entrenado usando datos de síntesis de imágenes y videos sin etiquetar. Después de aprender, el modelo puede "predecir" lo que sucederá junto a la imagen, dónde moverse y moverse en muy poco tiempo a la ubicación. donde aparecerá la imagen para formar un video corto.

Dirección del sitio web oficial: https://makeavideo.studio/

Shangtang Zhiying
Shangtang Zhiying es una plataforma integral de publicidad y marketing lanzada por Shangtang Technology, que incluye el motor de creación de videos cortos "Shangtang Zhiying".

Esta herramienta puede generar videos cortos creativos con un clic, incluida la generación de secuencias de comandos, el reemplazo de fondo, el reemplazo de pantalla horizontal y vertical, la generación de subtítulos y otros servicios de producción de publicidad de video corto. Puede ayudar a los anunciantes a ahorrar costos de producción de contenido publicitario y se ha convertido en un video corto. experto Artefacto del tesoro.

 

El servicio "Análisis de elementos de video" incluido en SenseTime puede analizar y extraer información como la duración, la escena, la escena, el personaje, los accesorios y las líneas de cada toma en un video corto a través de la tecnología de estructuración de video AI, y crear automáticamente un guión de toma en gran medida. reduce el tiempo de redacción de guiones y ayuda eficazmente a los creadores en la creación secundaria.

Es broma, Shangtang es posterior a Pangu Desde la perspectiva de los modelos grandes, ¿también está detrás de Huawei Pangu? Jajajajaja

Dirección del sitio web oficial: https://www.sensetime.com/cn/product-index

Supongo que te gusta

Origin blog.csdn.net/dreamer23/article/details/132146560
Recomendado
Clasificación