语音合成论文优选：Anyone GAN Sing - 代码天地

语音合成论文优选：Anyone GAN Sing

其他 2021-03-25 21:48:15 阅读次数: 0

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。

欢迎关注微信公众号：低调奋进

Anyone GAN Sing

本文为印度金奈SRM科技学院计算机科学与工程系在2021.02.22更新的文章，主要提出了ConvLSTM(convolutional Long Short-term Memory)来优化WGANsing歌唱合成系统，具体的文章链接

https://arxiv.org/pdf/2102.11058.pdf （我个人感觉比较有意思的是ConvLSTM的提出）

1 研究背景

歌唱合成相比TTS来说更加复杂，它需要考虑更加复杂的pitch和韵律变化等等因素。目前已经有很多的歌唱合成方案，本文主要是在基于Gan的WGANSing架构上进行优化，使合成的歌曲更加自然。（主要贡献点是ConvLSTM替代CNN）

2 详细设计

本系统是GAN的系统，主要包括生成器G和辨别器D，其LOSS为公式1，为了避免梯度消失等不稳定问题，本文使用Wasserstein-GAN,公式为2-5。

接下里主要说ConvLSTM的结构，图1位LSTM的结构，图2位CNN的结构，两者一结合形成图3 convLSTM的结构。其中本文系统的生成器架构为图4所示，整个系统架构为图5所示。和WGANSing不同之处就是使用ConvLSTM替代CNN。

3 实验

本文和WGANSing做比较，在客观指标对比table1所示，CovLSTM好于WGANSing。在主观评测图6，图7和图8，CovLSTM也是好于WGANSing。

4 总结

本文主要提出了ConvLSTM(convolutional Long Short-term Memory)来优化WGANsing歌唱合成系统，使其客观和主观指标都得到提升。

欢迎关注微信公众号：低调奋进

猜你喜欢

转载自blog.csdn.net/liyongqiang2420/article/details/114094794

语音合成论文优选：Anyone GAN Sing

语音合成论文优选：基于GAN声码器的成功原因？GAN Vocoder: MRD Is All You Need

GAN论文

GAN论文跟踪列表：the-gan-zoo

【GAN】二、原始GAN论文详解

GAN论文引用与研读

看的GAN论文介绍

GAN 论文阅读笔记

GAN 论文译文

GAN论文精读

【读论文】AT-GAN

Sing的签名算法

GAN

条件GAN论文简单解读

Bayesian GAN 论文笔记

Couple GAN论文笔记

GAN最新论文解读

【论文译文】S³GAN（CompareGAN）

【GAN】三、DCGAN论文详解

Adobe PDF CoolType SING漏洞的

sing 签名API接口安全

语音合成论文优选：Expressive Neural Voice Cloning

语音合成论文优选：Enhancing Monotonicity for Robust Autoregressive Transformer TTS

Github GAN 非平稳纹理合成

深度学习与GAN图像合成技术

语音合成论文优选：脑机接口的语音合成Advancing Speech Synthesis using EEG

语音合成论文优选：增量语音合成Alternate Endings Improving Prosody for ITTS

语音合成论文优选：使用脑电图来进行语音合成speech synthesis using eeg

语音合成论文优选:增量语音合成What the Future Brings: Investigating the Impact of Lookahead for Incremental Neural

GAN[1]：原始论文介绍及代码实战

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)