基于Tacotron模型的语音合成实践 - 代码天地

基于Tacotron模型的语音合成实践

其他 2019-12-23 21:50:49 阅读次数: 0

Tacotron模型架构图

（1）下载tacotron模型的实现到本地，这里是基于GitHub上一个tacotron模型的实现开展研究的，GitHub网址：https://github.com/keithito/tacotron，由于

谷歌没有给出tacotron模型的官方实现，这里给出了tacotron模型的非官方实现;

1) 研究是在linux下开展的，由于源码较多，只展示tacotron模型源码的基本结构如下：

2) 安装一些依赖项：

① 安装Python 3。

② 安装最新版本的TensorFlow。

③ 安装此模型的一些要求：pip install -r requirements.txt

requirements.txt 文件：

安装过程：

（2）基于预先训练好的模型来进行语音和成：

1) 下载并解压缩模型：

curl http://data.keithito.com/data/speech/tacotron-20180906.tar.gz | tar xzC /tmp

2) 运行服务器，基于端口（9000）

python3 demo_server.py --checkpoint /tmp/tacotron-20180906/model.ckpt

3) 将浏览器指向localhost：9000，即可输入要合成的内容，并输出合成的音频

合成中：

合成完毕：

（3）使用其他数据，训练，合成语音

1) 下载语音数据集，我们尝试下载了一些数据集，如LJ Speech（LJ语音数据集）；

2) 将数据集解压缩到 ai/tacotron（ai是我电脑下的一个目录）

解压缩后，对于LJ语音，对应的树如下所示：

tacotron

|- LJSpeech-1.1

|- metadata.csv

|- wavs

3) 预处理数据：

python3 preprocess.py --dataset ljspeech

4) 训练模型

python3 train.py

5) 从检查点合成

python3 demo_server.py –checkpoint ~/tacotron/logs-tacotron /model .ckpt-185000

可将“185000”替换为要使用的检查点编号，然后打开浏览器localhost:9000并键入您要说的内容，即可合成。

在使用其他数据集来训练和合成的时候，经常由于不知道参数的意义、如何设置，机器太慢，导致花了很长时间都没有效果，这一块没有做出理想的效果。

猜你喜欢

转载自www.cnblogs.com/xiaoxb17/p/12088478.html

基于Tacotron模型的语音合成实践

基于Tacotron汉语语音合成的开源实践

####好好好好####基于Tacotron汉语语音合成的开源实践

谷歌tacotron端到端的文本转语音合成模型实践

神经网络语音合成模型介绍-Tacotron 2

神经网络语音合成模型介绍-Tacotron

论文翻译-语音合成：Tacotron

20200824：汉字转语音（语音合成）（二）：Tacotron实践之算法原理篇

论文翻译-语音合成：Tacotron 2

TACOTRON:端到端的语音合成

端到端的TTS深度学习模型tacotron(中文语音合成)

基于语言模型的语音识别与语音合成技术

【论文翻译】Tacotron：端到端语音合成

谷歌Tacotron进展：使用文字合成的语音更加自然

基于混合模型的语音降噪实践

语音合成模型小抄(1)

【阅读论文】Tacotron2，结合wavenet通过mel频谱实现自然语音合成

神经网络语音合成模型介绍

语音合成部分模型--学习笔记

中文语音合成开源模型总结

语音合成

语音合成（speech synthesis）方向七：脑机接口之基于脑电图语音合成

从噪声到高质量语音合成的实现：基于噪声消除的语音合成方法

微信小程序：腾讯AI语音合成实践

语音识别与语音合成

语音识别语音合成

Tacotron 的基于 Guided Attention 的实现

Tacotron 的基于 Forward Attention 的实现

Tacotron 的基于 GMM Attention 的实现

基于PaddlePaddle语音识别模型

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

Ubuntu 14.04 下Fuel6.0安装部署

香港一小巴侧翻致1死16伤警方：未见机件故障

pikachu--XSS盲打

阅读深入理解JVM虚拟机笔记一

java.sql.SQLException: ORA-00932: 数据类型不一致: 应为 -, 但却获得 CLOB

oracle delete all object under an user

[LeetCode]20 Valid Parentheses 有效的括号

树形DP求树的直径【模板】

Context propagation over HTTP in Go

【PAT】（B）1053 住房空置率 (20)*

每日归档

更多

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)