arXiv每日推荐-3.2:语音/音频每日论文速递 - 代码天地

arXiv每日推荐-3.2:语音/音频每日论文速递

其他 2020-03-28 16:56:33 阅读次数: 0

同步公众号(arXiv每日学术速递)
【1】 A.I. based Embedded Speech to Text Using Deepspeech
标题：使用DeepSpeech的基于人工智能的嵌入式语音到文本
作者： Muhammad Hafidh Firmansyah, Gul Malik Urfa
链接：https://arxiv.org/abs/2002.12830

【2】 Deep Residual-Dense Lattice Network for Speech Enhancement
标题：用于语音增强的深层剩余稠密网格网络
作者： Mohammad Nikzad, Fanhua Shang
备注：8 pages, Accepted by AAAI-2020
链接：https://arxiv.org/abs/2002.12794

【3】 Multi-Modal Continuous Valence And Arousal Prediction in the Wild Using Deep 3D Features and Sequence Modeling
标题：使用深度3D特征和序列建模的多模态连续配价和野外唤醒预测
作者： Sowmya Rasipuram, Anutosh Maitra
链接：https://arxiv.org/abs/2002.12766

【4】 Towards Learning a Universal Non-Semantic Representation of Speech
标题：学习语音的普遍非语义表征
作者： Joel Shor, Yinnon Haviv
链接：https://arxiv.org/abs/2002.12764

【5】 DIHARD II is Still Hard: Experimental Results and Discussions from the DKU-LENOVO Team
标题：DIHARD II仍然很难：实验结果和来自dku-Lenovo团队的讨论
作者： Qingjian Lin, Ming Li
备注：Submitted to Odyssesy 2020
链接：https://arxiv.org/abs/2002.12761

【6】 A Novel Decision Tree for Depression Recognition in Speech
标题：一种新的用于语音抑郁识别的决策树
作者： Zhenyu Liu, Bin Hu
链接：https://arxiv.org/abs/2002.12759

【7】 Speech Synthesis using EEG
标题：基于EEG的语音合成
作者： Gautam Krishna, Mason Carnahan
备注：Accepted for publication at IEEE ICASSP 2020
链接：https://arxiv.org/abs/2002.12756

【8】 Comparison of Speech Representations for Automatic Quality Estimation in Multi-Speaker Text-to-Speech Synthesis
标题：多说话人文语转换合成中用于自动质量估计的语音表示的比较
作者： Jennifer Williams, Simon King
备注：submitted to Odyssey 2020
链接：https://arxiv.org/abs/2002.1264

原文链接：https://zhuanlan.zhihu.com/p/110269386

sapienst

发布了48 篇原创文章 · 获赞 29 · 访问量 3040

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_35894210/article/details/104610710

arXiv每日推荐-3.2:语音/音频每日论文速递

arXiv每日推荐-3.27:语音/音频每日论文速递

arXiv每日推荐-3.4：语音/音频每日论文速递

arXiv每日推荐-3.24: 语音/音频每日论文速递

arXiv每日推荐-3.22:语音/音频每日论文速递

arXiv每日推荐-3.19:语音/音频每日论文速递

arXiv每日推荐-3.11:语音/音频每日论文速递

arXiv:每日推荐-3.9:语音/音频每日论文速递

arXiv每日推荐-3.7: 语音/音频每日论文速递

arXiv每日推荐：语音/音频每日论文速递[02.25]

arXiv每日文章推荐：语音/音频每日论文速递[02.28]

arXiv每日推荐-3.2：计算机视觉/图像处理每日论文速递

arXiv每日推荐-3.24: 计算机视觉/图像处理每日论文速递

arXiv每日推荐-3.27:计算机视觉/图像处理每日论文速递

arXiv每日推荐-3.4：计算机视觉/图像处理每日论文速递[03.04]

arXiv每日推荐-3.22:计算机视觉/图像处理每日论文速递

arXiv每日推荐-3.19:计算机视觉/图像处理每日论文速递

arXiv每日推荐-3.14:计算机视觉/图像处理每日论文速递

arXiv每日推荐-3.11:计算机视觉/图像处理每日论文速递

arXiv每日推荐-3.7:计算机视觉/图像处理每日论文速递

arXiv每日推荐：计算机视觉/图像处理每日论文速递[02.28]

arXiv每日推荐-5.16:计算机视觉/图像处理每日论文速递

arXiv每日推荐：计算机视觉/图像处理每日学术速递[02.25]

kaggle每日推荐-3.9:计算机视觉/图像处理每日论文速递

每日学术速递4.4

每日学术速递4.2

每日学术速递3.31

每日学术速递3.21

每日学术速递4.6

每日学术速递3.16

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)