[论文阅读72]Parameter-Efficient Transfer Learning for NLP - 代码天地

[论文阅读72]Parameter-Efficient Transfer Learning for NLP

业界资讯 2023-07-30 00:17:41 阅读次数: 0

1. 基本信息

题目	论文作者与单位	来源	年份
Parameter-Efficient Transfer Learning for NLP	Neil Houlsby等Google Research，雅盖隆大学-波兰	PMLR	2019

Houlsby N, Giurgiu A, Jastrzebski S, et al. Parameter-efficient transfer learning for NLP[C]//International Conference on Machine Learning. PMLR, 2019: 2790-2799.

论文链接：http://proceedings.mlr.press/v97/houlsby19a.html

论文代码：

2. 要点

研究主题	问题背景	核心方法流程	亮点	数据集	结论	论文类型	关键字
大模型微调	微调参数不高效或无效	提出Adapter模块。基于Bert模型来进行实验，26个不同的分类任务。	针对每个任务仅添加少量可训练参数，之前网络的参数固定，参数高度复用。	26个分类。包括GLUE benchmark。	在训练很少的参数的情况下，可以接近训练全参数的效果。Adapter的GLUE得分为80.0，而完全微调为80.4。	模型方法	PETL,Adapter

引入Adapter的目标：对于N个任务，完全微调模型需要N x 预训练模型的参数数量。可是Adapter的目标是达到微调相当的性能，但总参数训练更少，理想情况下接近1 ×。

3. 模型(核心内容)

Adapter与transformer的结合框架。

在Transformer中的两个地方增加，一个地方在projection后面，一个地方在两个前向层后面；

对于每个Adapter层像一个瓶颈。它的参数比较原始模型少很多，也包含skip-connection. 只更新绿色部分部分。

4. 实验与分析

AutoML平台进行实验的。

4.1 数据集

GLUE benchmark

17个公开数据

SQuAD question answering

4.2 GLUE benchmark的结果

GLUE得分为80.0，而完全微调为80.4。

BERT_LARGE模型的总调参数为9.0 x ，表示这9个任务都得微调的总和；

Adapters的最好效果为80.0，而参数总量只为1.3倍于原模型参数据，训练的参数只有3.6%.

5. 小结

提出了与transformer相结合的adapter模型，可以在训练少参数的情况下达到全调的效果。想法很不错，效果也是比较好的。

猜你喜欢

转载自blog.csdn.net/ld326/article/details/130827854

[论文阅读72]Parameter-Efficient Transfer Learning for NLP

Adapter Tuning：详细解读Parameter-Efficient Transfer Learning for NLP

论文阅读：Towards a Unified View of Parameter-Efficient Transfer Learning对参数高效迁移学习的统一看法

Paramenter-Efficient Transfer Learning for NLP

转载:A Light Introduction to Transfer Learning for NLP

The State of Transfer Learning in NLP [18 AUGUST 2019]

迁移学习论文阅读：Transfer Learning via Learning to Transfer

【论文合集】Awesome Transfer Learning

NLP 中的 Transfer-learning（迁移学习）探究

transfer learning

Transfer Learning via Learning to Transfer

A Survey on Transfer Learning 论文笔记

【论文阅读】Classification of breast cancer histology images using transfer learning

迁移学习论文阅读：Taskonomy: Disentangling Task Transfer Learning

论文阅读笔记：Transfer Learning for Deep Sentiment Analysis

【论文阅读】Graph Few-shot learning via Knowledge Transfer

【论文阅读】An Interannual Transfer Learning Approach for CropClassification in the Hetao Irrigation 。。。

论文翻译--StarCraft Micromanagement with Reinforcement Learning and Curriculum Transfer Learning

讲座笔记 transfer learning via learning to transfer

NLP learning

NLP Learning | 初识NLP

Transfer Defect Learning

Transfer learning 详解

迁移学习(Transfer Learning)

Transfer Learning 相关知识

迁移学习-Transfer Learning

Pytorch Transfer learning

迁移学习 (Transfer Learning)

迁移学习（Transfer Learning）

4.Transfer Learning

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)