多模态论文汇总

企业开发 2023-04-08 19:49:46 阅读次数: 0

综述

Multimodal Machine Learning: A Survey and Taxonomy
论文网址：https://arxiv.org/pdf/1705.09406.pdf
中文翻译：Multimodal Machine Learning:A Survey and Taxonomy(多模态综述)
Multimodal Learning with Transformers: A Survey
论文网址：https://arxiv.org/pdf/2206.06488.pdf
中文翻译：300+篇文献！一文详解基于Transformer的多模态学习最新进展（内容不全，建议看原文）
开放型对话技术研究综述
总结：开放型对话系统研究综述
任务型对话系统中的自然语言生成研究进展综述

tutorial

Vision-Language Pretraining: Current Trends and the Future
网址：https://vlp-tutorial-acl2022.github.io/

模型

Transformer
论文网址：Attention Is All You Need
BERT
论文网址：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
李沐视频讲解：BERT 论文逐段精读【论文精读】
ViLT
论文网址：ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision
源码网址：https://github.com/dandelin/vilt
bryanyzhu视频讲解：ViLT 论文精读【论文精读】
个人笔记：【论文&模型讲解】ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision
VL-BEiT
论文网址：VL-BEiT: Generative Vision-Language Pretraining
相关论文：BEiT: BERT Pre-Training of Image Transformers
CLIP
论文网址：Learning Transferable Visual Models From Natural Language Supervision
源码网址：https://github.com/OpenAI/CLIP
bryanyzhu视频讲解：CLIP 论文逐段精读【论文精读】
个人笔记：【论文&模型讲解】CLIP（Learning Transferable Visual Models From Natural Language Supervision）
VideoBERT
论文网址：VideoBERT: A Joint Model for Video and Language Representation Learning
源码网址：https://github.com/ammesatyajit/VideoBERT
个人笔记：【论文&模型讲解】VideoBERT: A Joint Model for Video and Language Representation Learning
Two-Stream Convolutional Networks for Action Recognition in Videos
论文网址：https://arxiv.org/abs/1406.2199
个人笔记：【论文&模型讲解】Two-Stream Convolutional Networks for Action Recognition in Videos

猜你喜欢

转载自blog.csdn.net/Friedrichor/article/details/126939715

多模态论文汇总

看过的论文汇总

跨模态检索2023年最新顶会论文汇总

深度学习论文汇总

CNNs 入门论文汇总

目标检测-论文汇总

【论文汇总】Diffusion Models视频生成/视频编辑/可控视频生成/跨模态视频生成

区块链论文汇总（持续更新）

深度学习论文汇总（2018.6.25更新）

人脸识别必读论文汇总

【更新于12.29】深度学习论文汇总

ECCV 2020 Oral 论文汇总！

CVPR2019检测论文汇总

近几年RGBT论文汇总

农业类计数论文汇总

CVPR ECCV ICCV论文汇总

葡萄采摘定位论文汇总(二)

葡萄采摘定位论文汇总(一)

深度学习论文汇总（2018.4.21更新）深度学习论文汇总（2018.4.21更新）

【论文笔记】attention-based model 论文汇总

最新最全论文合集——STOC 历年最佳论文汇总

最新最全论文合集——ICDE 历年最佳论文汇总

最新最全论文合集——KDD 历年最佳论文汇总

最新最全论文合集——ISCA 历年最佳论文汇总

最新最全论文合集——IDAC 历年最佳论文汇总

最新最全论文合集——MOBICOM 历年最佳论文汇总

最新最全论文合集——ASPLOS 历年最佳论文汇总

最新最全论文合集——PLDI 历年最佳论文汇总

最新最全论文合集——SOSP 历年最佳论文汇总

最新最全论文合集——ISSTA 历年最佳论文汇总

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)