Athena跑aishell数据集 - 代码天地

Athena跑aishell数据集

企业开发 2020-04-10 10:40:32 阅读次数: 0

Athena是端到端自动语音识别（ASR）引擎。当前，该项目支持基于 Connectionist Temporal Classification (CTC)的模型，基于transformer-basesd encoder-decoder model and Hybrid CTC/attention的模型的训练和解码，以及unsupervised pretraning。

下面我们基于Athena跑一下aishell数据集。

机器环境：
Ubuntu16.04 GPU GeForce RTX 2080
TensorFlow2.01 cuda10.2

1.设置虚拟环境
python -m venv venv_athena
source venv_athena/bin/activate
pip install --upgrade pip

2.安装 Athena
git clone https://github.com/athena-team/athena.git
cd athena
pip install -r requirements.txt
python setup.py bdist_wheel sdist
python -m pip install --ignore-installed dist/athena-0.1.0*.whl
source tools/env.sh

3.数据准备。
到 http://www.openslr.org/33/上下载aishell数据集，这里我用axel下载速度比较快。
axel -n 15 http://www.openslr.org/resources/33/data_aishell.tgz
下载完成。解压存放asr目录下面。
在这里插入图片描述
执行aishell脚本即可。
sh examples/asr/aishell/run.sh
注意：这里的dataset_dir改为存放aishell数据的目录，由于我这机器只有一个GPU，所以屏蔽掉了分布式工具horovod。

先跑pretraining 模型，再fine-tuning。

这里设置batch_size为16 num_epoch设置为20。（由于机器内存不够只能将batch设置小一点，否则会报内存溢出错误）
在这里插入图片描述
fine-tuning也设置batch_size为16 num_epoch设置为8。

跑了将近两天才跑完整个训练流程。
在这里插入图片描述

cheetah_qiufeng

发布了12 篇原创文章 · 获赞 7 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/zyjzyj55/article/details/105386192

Athena跑aishell数据集

使用AWS Athena查询Apache Hudi数据集

数据处理aishell

gmapping跑数据集

语音处理之开源数据集AiShell 3，个性化合成

TransFuse跑自己的数据集

官宣！AWS Athena正式可查询Apache Hudi数据集

新的征程以及AISHELL x-vector跑分

使用自己的数据集跑EMVS实验

安装cartographer，跑官网数据集

Polyp-PVT跑自己的数据集

【含泪总结！】kaldi声纹识别模型跑通aishell中的v1遇到的坑

kaldi ：详解aishell-1全过程【**数据准备**】

如何用事先录好的数据集跑gmapping

用数据集跑ORB_SLAM2

Ubuntu上Kaldi跑librispeech数据集步骤

服务器初次跑YOLO数据集总结

工程（十七）——自己数据集跑R2live

工程（十六）——自己数据集跑Fast_livo

直接用笔记本摄像头跑orb_slam3单目程序不再跑数据集

在Ubuntu20.04系统上LIO-SAM跑KITTI数据集和自己数据集代码修改

aishell数据处理为thchs30格式

ORB_SLAM2跑数据集卡住不生成关键帧轨迹txt文件

我的AI之路(20)--用Tensorflow object_detection跑raccoon数据集

我的AI之路(21)--用Tensorflow object_detection跑PASCAL VOC 2012数据集

==4==tesorflow目标识别API跑VOC2012数据集

使用Kinect V2制作自己的图片数据集并跑通ORB_SLAM2

ORB_SLAM2跑TUM——单目和RGBD数据集

orbslam2跑自己的数据集--问题解决

用ORB_SLAM2跑数据集的经历（包括地图保存与重载）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)