Kaldi中语音数据增强方法 - 代码天地

Kaldi中语音数据增强方法

其他 2020-04-10 11:16:04 阅读次数: 0

在实际应用中，有时候数据不是很多，可以用数据增强方式
扩展数据，在小的数据集上效果比较明显。

语音数据增强主要有以下几种方式：

音速扰动sp
utils/data/perturb_data_dir_speed_3way.sh

音量扰动vp
utils/data/perturb_data_dir_volume.sh

kaldi里面数据增强脚本是存放在utils/data 目录下。
加上去年谷歌提出新型自动语音识别SpecAugment数据增强方式
SpenAugment参考了图像的做法，SpenAugment方法直接增强了频谱图，而不再是音波数据上。这种方法的数据增强是直接使用在输入特征上的，可以实时动态添加，而不需要像对音波进行数据增强一样有很多计算代价而影响到训练速度。
在这里插入图片描述
采用扭曲时域信号，掩盖频域通道，和掩盖时域通道，修改了频谱图。

在kaldi里面已经有将SpenAugment集成进去，在network.xconfig中增加
spec-augment-layer name=spec-augment freq-max-proportion=0.5 time-zeroed-proportion=0.2 time-mask-max-frames=20
delta-layer name=delta input=spec-augment即可。

我尝试用SpecAugment数据增强方式训练模型，在minilibirispeech上训练，WER降低了两个点左右，还是有提升。我在300多个小时的英语数据集合上用了6个epochs并没有发现有提升，可能还要加大epochs，由于增加epochs会增加训练时间，我并没有继续实验下去。看到danpovey在论坛中讨论说libirispeech上并没有复现出来，
谷歌可能是在TPU上训练几百个epochs实验出来的。

cheetah_qiufeng

发布了12 篇原创文章 · 获赞 7 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/zyjzyj55/article/details/104990073

Kaldi中语音数据增强方法

语音识别中的数据增强技术

语音识别学习记录 [kaldi中的openfst]

NLP中的数据增强方法

解析kaldi中的yesno的语音分帧和模型

Kaldi语音识别工具运行TIMIT数据库实例

【语音识别】详解kaldi的数据和模型文件——librispeech

kaldi语速增强

语音识别kaldi

kaldi语音识别

深度学习中的数据增强方法

语义分割中的数据增强方法

深度学习中的数据增强的方法调研

[中文语音识别后文本加标点] 文本数据增强方法

语音识别数据增强方法（google2019年7月论文）

YouTube 故事中的视听语音增强

语音增强

开源语音识别工具kaldi

语音识别-kaldi下载与安装

kaldi中文语音识别(1)

数据增强方法总结

数据增强方法

数据增强的方法

Kaldi运行thchs30中文语音识别教程

深度学习中的各种数据增强方法大全

NLP中的数据增强

Kaldi中thchs30训练自己数据集的步骤

KALDI语音识别新手区

语音识别学习记录 [kaldi的chain model]

语音识别工具库Kaldi入门

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

周排行

010-题目：利用条件运算符的嵌套来完成此题：学习成绩>=90分的同学用A表示，60-89分之间的用B表示，60分以下的用C表示。

接口测试-工作心得记录八（使用locust库书写接口并发）

物理分页和逻辑分页

Hive建表语句详解--CREATE TABLE

爬虫学习----学习get和post请求

PDF生成类库

POJ 2139

前端路由基本原理

I/O多路转接之epoll

.NET开源项目 QuarkDoc 一款自带极简主义属性的文档管理系统

每日归档

更多

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)