多模态数据联合Embedding的方法小结 - 代码天地

多模态数据联合Embedding的方法小结

其他 2019-07-18 19:11:36 阅读次数: 0

当模型需要接受多个模态的数据时，往往需要设计合适的方法让他们能进行信息的融合，Joint embedding是一种较为普遍的思路，即将他们映射到同一个向量空间中，再进行融合。

向量拼接、元素级相乘、做out product得到矩阵、求和。缺点是缺乏表达能力
Multimodal Compact Bilinear pooling (MCB)^[1]，首先把两个模态的特征向量独自和未来需要组合的内容共同映射到一个低维空间中，两个低维向量再做out product得到矩阵（作者使用FFT在频域上进行out product以降低计算复杂度，再将结果转换回来）。随后还有Multimodal Low-rank Bilinear pooling (MLB)^[^2]、Multimodal Factorized Bilinear pooling (MFB)^[3]原理都较为类似。
Multimodal Residual Networks (MRN)^[4]受到深度残差结构的启发，利用神经网络去学习联合embedding并在其中加入shortcuts使其两个模态可以互相影响共同学习映射。

[1] Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding

[2] Hadamard product for low-rank bilinear pooling

[3] Multi-modal factorized bilinear pooling with co-attention learning for visual question answering

[4] Multimodal residual learning for visual qa

猜你喜欢

转载自www.cnblogs.com/LukeStepByStep/p/11209317.html

多模态数据联合Embedding的方法小结

面向文本和视觉线索联合推断的多模态上下文推理方法 | ACL 2023

多模态方法(更新中)

【多模态】多模态特征融合策略——门控多模态融合方法

联合嵌入joint embedding

多模态 | 多模态中单模态中提取特征方法（代码）

Pachyderm跨模态多模态数据融合与游戏设计

多模态视频-文本检索方法

多种多模态图像融合方法

多模态深度学习方法简介

论文阅读-AVoiD-DF: Audio-Visual Joint Learning for Detecting Deepfake（多模态数据集DefakeAVMiT+多模态鉴伪方法AVoiD-DF）

多模态

如何使用多类型数据预训练多模态模型？

澳鹏与Reka AI强强联合，构建高质量的多模态LLM应用

【NeurIPS 2023】多模态联合视频生成大模型CoDi

【多模态】1、几种多模态 vision-language 任务和数据集介绍

ChatGPT是否能够处理多模态数据和多模态对话？

【车流量时空数据挖掘】一种基于多模态深度学习的混合交通流预测方法

oracle数据多库联合查询

gragh embedding相关论文小结

面向目标的多模态情感分析方法

基于深度学习的多模态数据融合（二）

多模态数据下的学习投入特征画像研究

多模态文档理解：基础概念-数据-模型

多模态分析数据集（Multimodal Dataset）整理

多模态分割医学数据集小调研

港中文联合上海AI Lab发布多模态(12种)学习统一框架：Meta-Transformer

多模态AI算法

什么是多模态学习？

多模态融合

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)