文本数据增强方法

企业开发 2021-02-26 10:11:15 阅读次数: 0

文章目录

1. EDA
2. 回译
3. 环境安装
- 3.1 安装synonyms
4. 代码链接

在人工智能领域中，最核心的莫过于算法、数据和算力。随着科技的发展，算力日益增长、算法日益智能，高质量的数据成为了阻碍AI发展的一大瓶颈。
在计算机视觉领域中，数据增强的方法较为常用，例如通过图像缩放、图像裁剪、mixup等数据增强的方法可以有效的提高任务的准确率。随着技术的发展，在自然语言处理领域中也产生了一些有效的数据增强算法，例如EDA(Easy Data Augmentation)、回译、文本生成等。在NLP比赛中，比较简单但却有效的方法主要是EDA和回译。

1. EDA

EDA指的是简单数据增强，包括了同义词替换、随机插入、随机删除、随机交换。其中同义词替换指的是从句子中随机选取一定比例的词(不属于停用词的，下同)，使用同义词来替换它们；随机插入指的是从句子中随机选取词，然后得到该词的同义词，并将同义词插入句子的一个随机位置，将上述操作重复进行若干次；随机删除指的是在随机选择句子中一定比例的单词进行删除；随机交换指的是在句中随机选择两个不同位置的单词，并将其进行交换，将上述操作重复进行若干次。为了更好的进行理解，通过实例来进行说明，原始句子为：带着无限同情偷转导师日志：学

猜你喜欢

转载自blog.csdn.net/herosunly/article/details/113997077

文本数据增强方法

text 文本数据增强方法 data argumentation

[中文语音识别后文本加标点] 文本数据增强方法

NLP文本数据增强热门技术

文本数据的batching方法

Pytorch 文本数据分析方法(标签数量分布、句子长度分布、词频统计、关键词词云)、文本特征处理(n-gram特征、文本长度规范)、文本数据增强(回译数据增强法)

文本数据增强四（马尔可夫marko(HMM)）

使用NLPAUG 进行文本数据的扩充增强

[转]MATLAB读取文本数据的方法

Python~Pandas 文本数据方法 cat()

用于文本分类的数据增强方法

读写文本数据

文本数据的匹配

处理文本数据

【pandas】文本数据

julia读取纯数字的文本数据方法

12-文本数据提取方法--简介

几种简单的文本数据预处理方法

即插即用！RandomMix：一种混合样本数据增强新方法

【论文阅读】AugGPT: Leveraging XXX for Text Data Augmentation（AugGPT:利用XXX进行文本数据增强）

Pandas 读取文本数据

文本数据挖掘实践

文本数据分析

Hive导入文本数据

excel 导入文本数据

pandas 处理文本数据

对处理文本数据的认识

Pandas处理文本数据

文本数据处理

keras处理文本数据

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)