【学习】domain adaptation、BERT

企业开发 2023-07-12 06:33:40 阅读次数: 0

文章目录

一、domain adaptation领域适应
二、自监督学习

一、domain adaptation领域适应

在这里插入图片描述
训练资料和测试资料分布不一样。
域转移domain shift:训练和测试数据有不同的分布。

domain shift

在这里插入图片描述
想法:通过源数据训练模型，然后通过目标数据微调模型
挑战:只有有限的目标数据，所以要小心过度拟合

domain adversarial training

希望他们的分布没有差异
在这里插入图片描述

右边的好一点，可以让他们远离界限，下面就是这种做法

domain generalization

没有未知领域的资料
在这里插入图片描述

二、自监督学习

在这里插入图片描述

多语言BERT的跨语言能力

在这里插入图片描述

无视不同语言的差别，了解语义。

在这里插入图片描述

MRR分数越高越好

实际上BERT在做QA的时候用的是同一种语言，可以看出语言之间是有差异的，只是没找到。

我们找到英文和中文符号之间的平均之后，得到差距，就能互换了

交叉学科能力

在这里插入图片描述

BERT在优化和generalization上都做的好

但是还是要有文字语音对应的资料

有没有可能只有语音资料呢？

训不了
把VQ进行离散化，加入自注意，不行：

把这些符号换成文字，可以实现：

用人工数据进行预训练

在这里插入图片描述

通过生成不同规则的人工数据，可以知道前期训练成功的关键因素是什么。

扫描二维码关注公众号，回复： 15651561 查看本文章

在这里插入图片描述

人工数据的预培训：与从头开始培训相比，平均绝对改进(%)
随机令牌上的预训练产生与从头开始训练相同的性能，没有用
成对资料有用：

产生连续编号的序列，打乱之后掩码，做的也比较好。

到底什么能力对NLP任务是有用的呢？
与从头开始培训相比，平均绝对改进(%)：
在这里插入图片描述
长序列对于任务是有用的。

猜你喜欢

转载自blog.csdn.net/Raphael9900/article/details/128519591

【学习】domain adaptation、BERT

迁移学习——Domain Adaptation

领域适应学习(domain adaptation）

迁移学习之Domain Adaptation

Domain Adaptation

对抗对齐分布--Adversarial Domain Adaptation for Cross-lingual Information Retrieval with Multilingual BERT

域适应学习笔记：visual Domain Adaptation

迁移学习数据集——Domain Adaptation

域适应（Domain adaptation）

Domain Adaptation论文合集

Open Set Domain Adaptation

【李宏毅机器学习】Domain Adaptation 域适应

李宏毅学习笔记42.More about Domain Adaptation. Part I. Domain Adaptation

CVPR 2019之迁移学习：Contrastive Adaptation Network for Unsupervised Domain Adaptation

Domain Adaptation论文笔记

DANN：Unsupervised Domain Adaptation by Backpropagation

Domain Adaptation and Graph Neural Networks

Cross Domain，Domain Adaptation，Domain Generalization概念的解释

【迁移学习】domain adaptation and metric learning基础知识及博客整理

【深度学习】论文导读：无监督域适应（Deep Transfer Network: Unsupervised Domain Adaptation）

半监督学习算法——ATDA(Asymmetric Tri-training for Unsupervised Domain Adaptation)

半监督迁移学习-Deep Asymmetric Transfer Network for Unbalanced Domain Adaptation

李宏毅学习笔记43.More about Domain Adaptation. Part II. Applications

迁移学习论文解读：《Unsupervised Domain Adaptation via Structurally Regularized Deep Clustering》

【迁移学习论文四】Multi-Adversarial Domain Adaptation论文原理及复现工作

【迁移学习论文六】Learning Semantic Representations for Unsupervised Domain Adaptation论文原理及复现工作

论文笔记：Contrastive Adaptation Network for Unsupervised Domain Adaptation

Importance Weighted Adversarial Nets for Partial Domain Adaptation

Domain Adaptation via Transfer Component Analysis

Geodesic flow kernel for unsupervised domain adaptation

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)