AI教程之谷歌的新 Imagen 视频从文本生成视频

企业开发 2023-04-08 00:21:04 阅读次数: 0

谷歌发布了Imagen Video，这是一个可以根据文本提示生成视频的 AI 系统。这看起来像是 Google 对Meta (Facebook 2.0)最近宣布的 Make-A-Video的回应。

这是初步结果的样子。

Imagen Video 在 1400 万个视频-文本对和 6000 万个图像-文本对以及公开可用的 LAION-400M 图像-文本数据集上进行训练，使其能够以每秒 24 帧的速度生成 1280x768 视频。

这个怎么运作

该过程从输入文本提示开始，并使用 T5 文本编码器将其编码为文本嵌入。然后，扩散模型生成 24x48 分辨率和每秒 3 帧的 16 帧视频。

然后使用一系列时间超分辨率 (TSR) 和空间超分辨率 (SSR) 模型进行上采样并生成更高的帧速率，在 1280x768 分辨率下高达 128 帧和每秒 24 帧的视频。

同样重要的是要注意 AI 模型能够呈现文本。DallE2 和 Stable Diffusion 等可公开访问的模型尚不具备这种能力。

在这里插入图片描述
谷歌声称，Imagen Video不仅能够生成高保真视频，而且具有高度的可控性和世界知识，使其能够生成不同艺术风格的动态。

在这里插入图片描述
它甚至可以理解 3D 上下文和

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/127262528

AI教程之谷歌的新 Imagen 视频从文本生成视频

谷歌新作Imagen：用Transformer和扩散模型把"文字到图像生成"卷上天！

生成式 AI 背后的共同框架：Stable Diffusion、DALL-E、Imagen

AI短视频制作一本通：文本生成视频、图片生成视频、视频生成视频

AI生成式视频技术来临：Runway Gen-2文本生成视频

【赠书第14期】AI短视频制作一本通：文本生成视频+图片生成视频+视频生成视频

【兔子王赠书第8期】AI短视频制作一本通：文本生成视频+图片生成视频+视频生成视频

AI作画新高度！谷歌发布imagen，效果惊艳全场

Imagen 2 发布、Gemini Pro 免费体验、代码平台 Duet AI 上线，谷歌大爆发

短视频模型Imagen Video：艺术和3D建模大师

这个AI爆火！输入1句话，生成1段视频！清华提出CogVideo：最大的文本生成视频模型...

VideoFusion，damo文本生成视频

TensorFlow文本生成（AI 写诗）

如何中文AI自动文本生成

keras实战教程三(文本生成)

AI 视频 | 文本生视频工具又迎来重大更新，Runway Gen-2 到底有多强？Gen-2 怎么用（保姆级教程）

谷歌发布新大语言模型：零样本生成10秒视频达SOTA！网友：压力给到Runway/Pika

Windows下文本生成图像AI画图尝鲜体验

AI文本生成器助力，打造优质内容

bitmap+文本生成新的bitmap的实现

Android 图片和文本生成新的图片（Canvas）

AICG,人工智能自动生成内容——根据文本生成图像，视频，音频

谷歌推大语言模型VideoPoet：文本图片皆可生成视频和音频

行业洞察 | 文本生成视频，Meta、Google哪家更胜一筹？

Stability AI 开源 Stable Diffusion，基于文本生成图像的 AI 模型

谷歌推出新的文本生成图像模型“Muse”，声称性能为同类最佳

ai视频生成工具智能剪辑自动生成视频

EMNLP2018 | 腾讯AI Lab深度解读文本生成技术相关论文

用ai文本生成工具告诉你，创作其实很简单

苹果的「AI 建筑师」GAUDI：根据文本生成 3D 场景

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)