End-to-End Multi-Task Learning with Attention(CVPR2019) - 代码天地

End-to-End Multi-Task Learning with Attention(CVPR2019)

其他 2020-02-21 12:17:30 阅读次数: 0

Multi-Task Attention Network(MTAN)--包含全局特征池的共享网络、每个任务的软注意模块

优点：可以端到端训练、可以建立在任意前馈神经网络上、实现简单、参数效率高

背景：

与标准的单任务学习相比，在成功学习到共享表示的同时训练多任务有两个主要的挑战：

1）网络结构（如何共享）：

多任务学习体系结构应该同时表达任务共享和任务特定的特性。通过这种方式，网络被鼓励学习一个通用的表示(以避免过度拟合)，同时还提供了学习针对每个任务的特性的能力(以避免欠拟合)

2）损失函数(如何平衡任务):

一个多任务损失函数，它对每个任务的相对贡献进行加权，应该使所有任务的学习具有同等的重要性，而不是让更容易的任务占主导地位。手动调整损耗权值是繁琐的，最好是自动学习权值，或者设计一个对不同权值具有鲁棒性的网络。

MTAN网络结构组成：

MTAN由两个部分组成:单个共享网络和K个任务特定注意力网络。共享网络可以根据特定的任务进行设计，而每个具体子任务的网络由一组注意力模块组成，这些注意力模块与共享网络相连接。每个注意力模块对共享网络的特定层应用一个软注意掩码，以学习特定于任务的特性。因此，注意力掩码可以看作是来自共享网络的特征选择器，它以端到端的方式自动学习，而共享网络则跨所有任务学习一个紧凑的全局特性池。

猜你喜欢

转载自www.cnblogs.com/zwp-28/p/12340780.html

End-to-End Multi-Task Learning with Attention(CVPR2019)

【l论文阅读】An Interactive Multi-Task Learning Network for End-to-End Aspect-Based Sentiment Analysis

End-to-end Learning

【ICCV 2019】Unsupervised Multi-Task Feature Learning on Point Clouds

【论文阅读】【2023CVPR】Optimal Proposal Learning for Deployable End-to-End Pedestrian Detection

End-to-End Machine Learning Project

[论文阅读] End-to-End Incremental Learning

A Summary of Multi-task Learning

An end-to-end TextSpotter with Explicit Alignment and Attention

Collection | Multi-task learning & Transfer learning

多任务适配扩展：BERT and PALs: Projected Attention Layers forEfficient Adaptation in Multi-Task Learning

图像跟踪 - MOTRv2: Bootstrapping End-to-End Multi-Object Tracking by Pretrained Object ... (CVPR 2023)

Random Forest in Python: A Practical End-to-End Machine Learning Example

CFNet：End-to-end representation learning for Correlation Filter based tracking

深度学习的 “ 端到端模型（end-to-end learning）”

TVM: End-to-End Optimization Stack for Deep Learning

端到端的学习end-to-end learning （理解）

《End-to-End Learning of Motion Representation for Video Understanding》论文阅读

《End-to-End Learning of Motion Representation for Video Understanding》文献阅读

深度学习的“ 端到端模型“（end-to-end learning）

端到端的学习（end-to-end learning）

Learning latent representations for style control and transfer in end-to-end TTS

OmniMVS拜读：End-to-End Learning for Omnidirectional Stereo Matching

PivotNet：Vectorized Pivot Learning for End-to-end HD Map Construction

多任务学习 Multi-task learning

An Overview of multi-task learning阅读笔记

Multi-Task Learning & Multiclass classification

多任务学习Multi-Task Learning

Thinking about Multi-Task Learning

论文阅读 | A Survey on Multi-Task Learning

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)