[半监督学习] Simple semi-supervised training of part-of-speech taggers

企业开发 2023-04-07 21:35:46 阅读次数: 0

这篇论文将半监督学习应用在词性标注(POS)上, 在当时取得了不错的效果. 不过这篇文章非常简洁, 全部内容只有4页, 是 NLP 领域的顶会 ACL 上的短文. 主要的贡献是对 Tri-Training 进行简单改进, 提出带分歧的 Tri-Training. 由于是当时没人将这种 Tri-Training 引入到 POS 中, 所以这篇文章还能在 ACL 上发表.

论文地址: Simple semi-supervised training of part-of-speech taggers
会议: ACL 2010
任务: 词性标注

Tri-Trianing

Tri-Training 的思想总结如下: 首先从标记数据集 $L$ 中用 bootstrap 采样获得三个不同的数据集 $S_i$ , 这样做的目的是增加多样性, 然后使用 $S_i$ 训练三个分类器 $c_i$ . 对于未标记数据集 $U$ 中的示例 $x$ , 如果 $c_j$ 和 $c_k$ 对其预测的结果一致, 那么就把 ${(x_i,c_j(x))\}$ 添加到 $c_i$ 的训练集 $L_i$ 中, 并利用更新后的 $L_i$ 重新训练 $c_i$ . 一直重复这个过程, 直到三个分类器不在发生变化为止. 最终的预测结果通过分类器的多数投票结果给出. 一些算法细节可以去看 Tri-Training 原文, 或之前的文章 Tri-Training. Tri-training 算法如下:
在这里插入图片描述

带分歧的 Tri-training

带分歧的 Tri-training 改动非常简单, 直接对上图算法中的第9, 10行进行修改, 如下所示:
在这里插入图片描述
非常容易理解, 如果分类器 $c_j$ 和 $c_k$ 都同意对数据 $x$ 的预测, 但 $c_i$ 不同意, 就可以自然的认为 $x$ 是 $c_i$ 的弱点. 并希望通过 $x$ 来加强 $c_i$ .

猜你喜欢

转载自blog.csdn.net/by6671715/article/details/123056208

[半监督学习] Simple semi-supervised training of part-of-speech taggers

[半监督学习] Deep Co-Training for Semi-Supervised Image Recognition

[半监督学习] Semi-supervised Learning for Regression with Co-training by Committee

机器学习15：半监督学习semi-supervised

Semi-Supervised Learning---半监督学习

12、Semi-supervised Learning（半监督学习）

Semi-supervised Learning ;半监督学习

半监督学习（SEMI-Supervised Learning）

（ICASSP 19）SEMI-SUPERVISED AND POPULATION BASED TRAINING FOR VOICE COMMANDS（Speech Commands Dataset）

12、【李宏毅机器学习（2017）】Semi-supervised Learning（半监督学习）

李宏毅机器学习笔记-12：Semi-supervised Learning半监督学习

[李宏毅-机器学习]半监督学习 semi-supervised learning

机器学习10 -- 半监督学习 Semi-supervised Learning

【深度学习】半监督学习 Efficient Teacher: Semi-Supervised Object Detection for YOLOv5

Strong Baselines for Neural Semi-supervised Learning under Domain Shift半监督学习

半监督学习综述：A survey on semi-supervised learning 2020年

半监督学习——FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence

[半监督学习] Tri-net for Semi-Supervised Deep Learning

[半监督学习] Deep Metric Learning-Based Semi-Supervised Regression With Alternate Learning

一文看遍半监督学习模型（Semi-Supervised Learning）

ICLR17 - 用于半监督学习的时序融合《TEMPORAL ENSEMBLING FOR SEMI-SUPERVISED LEARNING》

Semi-Supervised Sequence Modeling with Cross-View Training

Semi-supervised（半监督）布料缺陷检测实战

Deeper Insights into Graph Convolutional Networks for Semi-Supervised Learning 深入了解半监督学习的图卷积网络GCN

【GAN ZOO翻译系列】Cat GAN：UNSUPERVISED AND SEMI-SUPERVISED LEARNING WITH CATEGORICAL GAN 用于监督和半监督学习的GAN

机器学习与深度学习系列连载：第一部分机器学习（十三）半监督学习（semi-supervised learning）

Adversarial Training Methods For Semi-Supervised Text Classification 虚拟对抗训练思路指引

【论文阅读笔记】3D human pose estimation in video with temporal convolutions and semi-supervised training

【CVPR 2022】半监督目标检测：Dense Learning based Semi-Supervised Object Detection

【ICLR 2021】半监督目标检测：Unbiased Teacher For Semi-Supervised Object Detection

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)