语音合成模型小抄(1)

物联网 2022-08-19 09:53:09 阅读次数: 0

前言

语音也是一个日渐热门的行业啊。给定一段文本，我们想让它被阅读出来.就需要使用到语音合成技术，也就是Text-to-Speech, 简称TTS。这里记录一下我看到的一些有意思的模型。

one-stage语音合成一般称为端到端 end-to-end
Two-stage语音合成步骤的，通常stage1:
文本 -(FFT)-> 语谱图 -(滤波)-> 梅尔谱/线性谱
stage 2: 将梅尔谱/线性谱生成波形(音频)

论文

VITS

Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
ICML 2021
论文: https://arxiv.org/abs/2106.06103
代码: https://github.com/jaywalnut310/vits

condition VAE + flow + GAN
flow可以看看v-flow和flow++这两篇文章。

知乎上看到两个论文笔记:
详细点的细读经典：VITS，用于语音合成带有对抗学习的条件变分自编码器
简短的【论文笔记】VITS_OlaWod

其中 monotonic alignment search 算法在 Glow-TTS 一文中有介绍。Glow-TTS是一个flow模型，官方代码: https://github.com/jaywalnut310/glow-tts

论文讲解: 基于cVAE+Flow+GAN的效果最好语音合成VITS模型论文精讲_bilibili
代码讲解: 基于cVAE+Flow+GAN的效果最好语音合成VITS模型代码逐行讲解_bilibili

关于Flow的一些介绍可以看这个: 神经网络(十五）标准化流(normalizing flow) 与INN

以及一些常见的flow模型代码实现https://github.com/janosh/awesome-normalizing-flows

猜你喜欢

转载自blog.csdn.net/weixin_43850253/article/details/126085711

语音合成模型小抄(1)

点云模型小抄(1)

风格迁移模型小抄(1)

全景分割模型小抄(1)

对比学习模型小抄(1)

无监督图像掩码模型小抄(1)

Transformer系列目标检测模型小抄(1)

CV轻量级backbone模型小抄(1)

超分辨率模型小抄(1)

NLP常用Backbone模型小抄(1)

神经网络语音合成模型介绍

基于Tacotron模型的语音合成实践

语音合成部分模型--学习笔记

中文语音合成开源模型总结

基于语言模型的语音识别与语音合成技术

语音合成

语音识别与语音合成

语音识别语音合成

神经网络语音合成模型介绍-Parallel Wavenet

神经网络语音合成模型介绍-DeepVoice3

神经网络语音合成模型介绍-Tacotron

神经网络语音合成模型介绍-Wavenet

神经网络语音合成模型介绍-Tacotron 2

神经网络语音合成模型介绍-ClariNet及总结

2021年语音合成论文统计（1~2月）

2021年语音合成论文统计（1~3月）

语音合成和语音识别

语音合成以及语音识别

语音识别与合成（待续）

speechSynthesis，TTS语音合成。

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

使用Redis中间件解决商品秒杀活动中出现的超卖问题（使用Java多线程模拟高并发环境）

野指针及c++指针使用注意点

redis 3.0　新特性

(翻译)火狐操作系统javascript API

微信小程序开发入门

mysql数据查询之五子句(where、group by、having、order by和limit)

Codeforces Round #517 Div. 1翻车记

在caffe 中实现Generative Adversarial Nets（二）

企业级漏洞扫描工具

java byte数组与String互转

每日归档

更多

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)