智源研究院发布 Emu2 —— 开源生成式多模态模型 - 代码天地

智源研究院发布 Emu2 —— 开源生成式多模态模型

业界资讯 2023-12-23 17:05:03 阅读次数: 0

2023年12月21日，智源研究院开源发布新一代多模态基础模型Emu2。

据介绍，Emu2是目前最大的开源生成式多模态模型，基于Emu2微调的Emu2-Chat和Emu2-Gen模型分别是目前开源的性能最强的视觉理解模型和能力最广的视觉生成模型。Emu2-Chat可以精准理解图文指令，实现更好的信息感知、意图理解和决策规划。Emu2-Gen可接受图像、文本、位置交错的序列作为输入，实现灵活、可控、高质量的图像和视频生成。

通过大规模自回归生成式多模态预训练，显著推动多模态上下文学习能力的突破。Emu2在少样本多模态理解任务上大幅超越Flamingo-80B、IDEFICS-80B等主流多模态预训练大模型，在包括VQAv2、OKVQA、MSVD、MM-Vet、TouchStone在内的多项少样本理解、视觉问答、主体驱动图像生成等任务上取得最优性能。

Emu2的模型、代码均已开源，并提供Demo试用。了解更多技术细节，参考Emu2论文。

项目：https://baaivision.github.io/emu2/
模型：https://huggingface.co/BAAI/Emu2
代码：https://github.com/baaivision/Emu/tree/main/Emu2
Demo：https://huggingface.co/spaces/BAAI/Emu2
论文：https://arxiv.org/abs/2312.13286

猜你喜欢

转载自www.oschina.net/news/272108

智源研究院发布 Emu2 —— 开源生成式多模态模型

AquilaChat-7B: 国产开源大模型新成员——AI领域的创新型研发机构智源人工智能研究院出品

重磅发布！智象视觉多模态生成式大模型

SEEChat：360人工智能研究院的中文多模态大模型

NO2！阿里研究院入选中国企业智库系统影响力榜

苹果发布开源多模态大语言模型 Ferret

伯克利AI研究院：强化学习是GPT2等自回归语言模型弥补不足的良方？

北京智源研究院联合牛津大学等推出 3D-GPT

人工智能领域又一突破！京东探索研究院推出超级深度学习模型ViTAEv2 准确度高达91.2%

达摩院开源多模态对话大模型mPLUG-Owl

微软亚洲研究院论文解读：基于动态词表的对话生成研究（PPT+视频）

浪潮信息AIStation联合智源研究院帮助用户灵敏获取本地AI算力

［雨松MOMO程序研究院］Unity3D研究院之脚本实现模型的平移与旋转（六）

［雨松MOMO程序研究院］Unity3D研究院之控制模型移动旋转与碰撞（七）

RISC-V 开源处理器“香山”新归属：北京开源芯片研究院

微软研究院开源编程语言Verona，借鉴Rust、Cyclone等特性

清华大学人工智能研究院开源“天授”强化学习平台

Unity2D研究院之精灵Sprite之间的碰撞事件

中国移动通信研究院笔试题2

三星研究院上机测试邮件范例2-optimal Path

中科院发布多模态 ChatGPT，图片、语言、视频都可以 Chat ？中文多模态大模型力作

轻量级年龄估计模型--C3AE（旷视研究院）

ViTPose+：迈向通用身体姿态估计的视觉Transformer基础模型 | 京东探索研究院

如何评测一个大模型？（微软亚洲研究院）

AI 时代保护儿童刻不容缓！智源研究院发布我国首个儿童人工智能发展原则《面向儿童的人工智能北京共识》

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

英特尔研究院探索负责任的生成式AI，让AI应用真正惠及大众

视频生成的原理解析：从Gen2、Emu Video到PixelDance、SVD、Pika 1.0、W.A.L.T

2023智源大会议程公开丨视觉与多模态大模型论坛

视觉与多模态大模型前沿进展 | 2023智源大会精彩回顾

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)