CVPR （《28篇论文、6 大主题带你一览 CVPR 2020 研究趋势》学习笔记六视觉与语言）

其他 2020-07-23 09:58:27 阅读次数: 0

原文链接：https://mp.weixin.qq.com/s/MkEwjHVC9M1JtdzZZdmeFw

视觉与语言

12合1：多任务视觉和语言表示学习

论文地址：https://arxiv.org/abs/1912.02315

基于视觉和语言的方法通常专注于少量孤立研究的独立任务。但是，作者指出，完成这些任务中的每一项都需要具有视觉基础的语言理解技能，这些技能明显重叠。

为此，本文提出了一种大规模、多任务的训练方案，该模型采用单一模型对来自以下四大类任务的12个数据集进行了训练：视觉问题回答、基于字幕的图像检索，基础引用表达式和多模式验证。使用单个模型有助于将参数数量从大约30亿个参数减少到2.7亿个，同时提高跨任务的性能。

该模型基于ViLBERT，其中每个任务都有一个特定任务的head网络，该head络分支出一个公共的共享干线（即ViLBERT模型）。拥有6个任务head，12个数据集以及超过440万个独立的训练实例，这种规模的多任务训练很难控制。为了克服这个问题，首先将所有模型都在同一数据集上进行预训练。然后使用循环批采样从多任务训练开始循环遍历每个任务，并在发现某些过拟合的情况下尽早停止（early stopping）以停下给定任务，并有可能重新开始训练以避免灾难性遗忘。

猜你喜欢

转载自blog.csdn.net/dujuancao11/article/details/107024849

CVPR （《28篇论文、6 大主题带你一览 CVPR 2020 研究趋势》学习笔记六视觉与语言）

CVPR （《28篇论文、6 大主题带你一览 CVPR 2020 研究趋势》学习笔记一图像识别，检测和分割）

CVPR （《28篇论文、6 大主题带你一览 CVPR 2020 研究趋势》学习笔记三表征学习）

CVPR （《28篇论文、6 大主题带你一览 CVPR 2020 研究趋势》学习笔记五迁移/小样本/半监督/无监督学习）

CVPR （《28篇论文、6 大主题带你一览 CVPR 2020 研究趋势》学习笔记四计算摄影）

CVPR （《28篇论文、6 大主题带你一览 CVPR 2020 研究趋势》学习笔记二生成模型和图像合成）

CVPR 2020论文方向统计

【CVPR 2020】ContourNet 论文学习笔记 | 深度学习训练

CVPR2020论文解析：视觉算法加速

ASLFeat（CVPR 2020）特征点检测论文笔记

《2020 CVPR 论文分享会|Session2：机器学习》

CVPR

图像分类：CVPR2020论文解读

CVPR 2020 开幕！最佳论文奖等揭晓！

CVPR2020 MOT MPNTracker 论文解读

CVPR2020 MOT TubeTK论文解读

EfficientDet(BiFPN)（CVPR 2020）

CVPR2020最新15篇论文开源代码

CVPR 2020 三篇有趣的论文解读

CVPR 2020 论文大盘点-语义分割篇

CVPR 2020 论文大盘点-目标检测篇

CVPR 2020 论文大盘点-动作识别篇

CVPR2020| 最新CVPR2020论文抢先看，附全部下载链接！

全球计算机视觉顶会CVPR 2020论文出炉：腾讯优图17篇论文入选

【CVPR2019】【CVPR腾讯】【CVPR 腾讯AI Lab】2019年腾讯AI Lab共33篇：解读六大前沿方向

重磅！ CVPR2020最新计算机视觉论文代码分类打包下载

CVPR 2020 论文大盘点-摘录自《我爱计算机视觉》

CVPR 2020论文开源项目一页看尽，附代码论文

White-box-Cartoonization_CVPR_2020白盒卡通化论文阅读笔记

论文阅读笔记（四十五）【CVPR2020】：Relation Feature 的应用

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)