多模态融合 Multimodal Fusion

其他 2020-01-14 12:46:03 阅读次数: 0

多模态融合 Multimodal Fusion

多模态融合（Multimodal Fusion ）负责联合多个模态的信息，进行目标预测（分类或者回归），属于 MMML 最早的研究方向之一，也是目前应用最广的方向，它还存在其他常见的别名，例如多源信息融合（Multi-source Information Fusion）、多传感器融合（Multi-sensor Fusion)。

按照融合的层次，可以将多模态融合分为 pixel level，feature level 和 decision level 三类，分别对应对原始数据进行融合、对抽象的特征进行融合和对决策结果进行融合。而 feature level 又可以分为 early 和 late 两个大类，代表了融合发生在特征抽取的早期和晚期。当然还有将多种融合层次混合的 hybrid 方法。

融合层次示意图

jwy2014

发布了88 篇原创文章 · 获赞 9 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/jwy2014/article/details/103968934

多模态融合 Multimodal Fusion

【论文笔记】多模态融合（Multimodal Fusion）

论文阅读-Attention Bottlenecks for Multimodal Fusion（多模态特征融合）

【CVPR 2022 多模态融合（有3D检测）】Multimodal Token Fusion for Vision Transformers

【论文阅读】Attention Bottlenecks for Multimodal Fusion---多模态融合，音视频分类，注意力机制

多模态融合算法——Multimodal Compact Bilinear Pooling

【华为云技术分享】多模态融合算法——Multimodal Compact Bilinear Pooling

Cross-Modal Complementary Network with Hierarchical Fusion for Multimodal Sentiment Classification

Fusion-Extraction Networkfor Multimodal Sentiment Analysis（CCF C类）

读《NFCMF: Noise Filtering and CrossModal Fusion for Multimodal Sentiment Analysis》

RGB-T追踪——【多模态融合】APFNet: Attribute-Based Progressive Fusion Network for RGBT Tracking

多模态融合2022|TransFusion: Robust LiDAR-Camera Fusion for 3D Object Detection with Transformers

Multimodal Machine Learning: A Survey and Taxonomy/多模态机器学习综述

Incomplete Multimodal Learning（不完整多模态学习）

【论文&模型讲解】多模态对话 Multimodal Dialogue Response Generation

多模态分析数据集（Multimodal Dataset）整理

论文阅读：multimodal remote sensing survey 遥感多模态综述

多传感器融合track fusion

多模态融合 - BEVFusion: Multi-Task Multi-Sensor Fusion with Unified Bird‘s-Eye View Repre ... (ICRA 2023)

多模态融合 2022|DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection阅读笔记

Multi-modal Sensor Fusion for Auto Driving Perception: A Survey（自动驾驶感知多模态传感器融合综述）

图像融合（Image Fusion）

[深度学习论文笔记]Robust Multimodal Brain Tumor Segmentation via Feature Disentanglement and Gated Fusion

读《MULTI-TENSOR FUSION NETWORK WITH HYBRID ATTENTION FOR MULTIMODAL SENTIMENT ANALYSIS》

Seeing Through Fog Without Seeing Fog:Deep Multimodal Sensor Fusion in Unseen Adverse Weather （翻）

VL系列 Exchanging-based Multimodal Fusion with Transformer 论文阅读笔记

【HDR】曝光融合（Exposure Fusion）

VINS Fusion GPS融合部分

多模态机器学习研究分类总结-Multimodal Machine Learning A Survey and Taxonomy

Multimodal Compact Bilinear Pooling（MCB）多模态紧凑双线性池

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)