【计算机科学】【2018.05】基于时延神经网络的混响鲁棒声学建模 - 代码天地

【计算机科学】【2018.05】基于时延神经网络的混响鲁棒声学建模

其他 2021-03-20 08:47:45 阅读次数: 0

在这里插入图片描述

本文为美国卡耐基梅隆大学（作者：Emanuel Jöbstl）的硕士论文，共73页。

本文研究了基于隐马尔可夫模型的鲁棒声学建模，用于语音识别系统。本文的工作重点是时延神经网络。我们首先设计了一个用于声学建模的时延神经网络模型，并给出了实验结果，证明了我们对设计参数的选择是正确的。然后，我们在增广数据上训练时延神经网络，并将其与传统的全连接神经网络在混响数据上的性能进行了比较。

This work investigates robust acoustic modeling for speech recognition systems based on hidden Markov models. The focus of this work is put on time delay neural networks. We first design a time delay neural network model for acoustic modeling and provide empirical results that justify our choice of design parameters. Then, we train the time delay neural network on augmented data, and compare its performance on reverberated data with conventional fully connected neural networks.

```
  引言
```
基础知识
相关工作
TDNN声学模型设计
混响数据评估
结论
附录最优解码器参数

更多精彩文章请关注公众号：在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_42825609/article/details/114178300

【计算机科学】【2018.05】基于时延神经网络的混响鲁棒声学建模

【计算机科学】【2015.05】基于卷积神经网络的鲁棒分类

【计算机科学】【2016.06】基于神经网络的鲁棒实时语音识别中的音频分割

【计算机科学】【2017.05】基于深度神经网络的特征选择

【计算机科学】【2017.12】基于深度神经网络的唇读研究

【计算机科学】【2004.05】基于神经网络的时间序列预测

【计算机科学】【2012.05】基于人工神经网络的常微分方程数值求解

【计算机科学】【2013】递归神经网络训练

【计算机科学】【2003】脉冲神经网络

【计算机科学】【2017.08】快速卷积神经网络

计算机视觉——day 91基于双网络的鲁棒特征高光谱目标检测（偏门且很水啊）

基于DL的计算机视觉（6）-- 神经网络

【计算机网络】时延、发送时延、传输时延、处理时延、排队时延、时延带宽积

【计算机科学】【2017】一种新的基于数学的神经网络分析框架

计算机网络中的时延

计算机网络--时延

通用评估神经网络鲁棒性方法—CLEVER

【计算机科学】【2016】【含部分源码】深度神经网络及其实现

【计算机科学】【2008.09】工程变分问题的神经网络

【计算机科学】【2005.12】神经网络在生物数据中的应用

【计算机科学】【2015.08】训练深度神经网络的快速图像识别方法

【计算机科学】【2012.12】训练深度神经网络进行瓶颈特征提取

【计算机科学】【2017.12】图像分类与回归的深度神经网络模型

【计算机科学】【1991.09】人工神经网络的理论与应用

【计算机科学】【2009.05】基于神经网络的系统辨识及其在暖通空调系统（HVAC）中的应用研究

2024年基于计算机视觉，深度学习卷积神经网络计算机毕业设计选题

计算机网络class4（时延、时延带宽积、RTT和利用率）

基于DL的计算机视觉（9）--神经网络之动手实践

基于DL的计算机视觉（8）-- 神经网络是如何训练的

【3D计算机视觉】ECC——基于图的动态边缘卷积神经网络

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)