语音识别基本原理介绍------dnn-hmm续 - 代码天地

语音识别基本原理介绍------dnn-hmm续

其他 2018-10-30 15:15:19 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u010384318/article/details/40452271

很久没更新博客了，最近找工作找的不是很顺利，我一直很看好语音的应用，觉得需求很多，但或许对应届生还是有些不一样，等确定了再分享下找工作的经验吧。这里主要说下语音识别现在大家都用的模型-----dnn-hmm，我自己也不能更好的去解释清楚，等我毕业前，我一定会把gmm-hmm和dnn-hmm的原理以最能理解的方式表达出来，我也很期待那一天。不多说了，直接说dnn-hmm。目前主流的方式是dnn-hmm，相信国内或者国外的用的都是这个，具体的应用主要参考li deng的这篇文章：Context-Dependent Pre-Trained Deep Neural Networks for Large-Vocabulary Speech Recognition。主要的算法我截图下：

这个是在gmm-hmm的模型基础上做的，最基本的也要生成一个tied-state的cd-gmm-hmm模型。然后就可以用上面的算法去做，训练出一个dnn-hmm的模型。然后我也用之前的博客：语音识别系统原理介绍-----dnn-hmm。在训练dnn之前，做了一些预处理，对应算法里的1-4步，也算是一些转换吧。从第5步开始做dnn的预处理，可以看下下面的图。

dnn'的输入是：左4帧+本身这一帧+右4帧，这样组成9帧，mfcc特征是39维，所以是39*9，这里的mfcc主要是去掉idct这一步，主要是dnn可以学到去相关这一步。第一层是GRBM，后面每层是RBM，这样一层一层的训练。然后根据gmm-hmm的对齐，使用后向传播算法对每一帧来做fine-tuning，根据先验概率重新估计转移概率，然后再利用这个继续训练dnn-hmm。基本就是这个训练的过程，如果你有什么问题，欢迎留言提问。

之前写的博客：

1.语音识别系统原理介绍-----dnn-hmm

2.语音识别系统原理介绍---从gmm-hmm到dnn-hmm

最后，现在一般使用kaldi来做dnn-hmm，当然如果你对htk很熟的话，你也可以基于htk写个dnn，这个资料我之前的博客也有介绍。

猜你喜欢

转载自blog.csdn.net/u010384318/article/details/40452271

语音识别基本原理介绍------dnn-hmm续

语音识别基本原理介绍之gmm-hmm续

语音识别系统原理介绍---从gmm-hmm到dnn-hmm

基于DNN-HMM的语音识别技术

语音识别基本原理介绍--gmm-hmm中训练的完整版

语音识别基本原理介绍----gmm-hmm中的embedded training （嵌入式训练）

语音识别学习记录 [GMM-HMM、DNN-HMM、MMI/BMMI/MPE/sMBR]

[语音识别] 06 基于DNN-HMM的语音识别系统

60分钟看懂HMM的基本原理

语音识别中的CTC算法的基本原理解释

sqlite基本原理介绍与操作

三消基本原理介绍

爬虫的基本原理介绍

zabbix监控-基本原理介绍

【网关----Zuul】基本原理及介绍

Dubbo基本原理介绍

RPC基本原理介绍

×××基本原理

基本原理

自动人脸识别基本原理

RCNN 目标识别基本原理

基于MATLAB的车牌识别基本原理及算法讲解

RFID无线射频识别技术基本原理FAQ

人脸识别实践(1) - 基本原理与设计思路

物体识别基本原理及其Python实现

隐马尔科夫链（hmm）基本原理和简单实例

语音识别：CD-DNN-HMM训练过程

java 实现https请求的基本原理与介绍

RabbitMQ的应用场景以及基本原理介绍

struts2的基本原理介绍

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)