3.3 基于GMM-HMM的语音识别 - 代码天地

3.3 基于GMM-HMM的语音识别

其他 2020-02-21 23:41:01 阅读次数: 0

语音识别技术解析
一、基本知识

语音识别系统的基本框架：特征提取+模式匹配

解码：基于搜索的模式匹配过程（语音识别的模式匹配是一个序列匹配问题，一般表现为一个搜索过程）。
解码器：实现解码的模块。
解码时所用的两个信息源：
- 声学模型：描述每个音素如何发音。
- 语言模型：描述单词的组合规律。

语音识别系统的标准配置：

2010年前：
（1）特征：Mel倒谱系数（MFCC）;
（2）声学模型：GMM-HMM；
（3）语言模型：N元文法（N-Gram）；
（4）解码：有限状态转移机（Finite State Transducer, FST）。
今天：语音识别已经过渡到了深度学习阶段，识别系统的基础框架不变，只是特征提取和声学建模的具体技术发生了改变。

二、MFCC特征提取：该特征主要描述与发音内容有关的声道信息，并模拟人耳的听觉特性，增加对低频段信息的敏感度。

三、GMM-HMM声学模型（概率模型）
在这里插入图片描述

HMM模型：描述发音动态特性
动态特性：语音信号在时间顺序上的发展演进过程。
GMM模型：描述短时静态特性。
静态特性：语音信号在某个短时平稳状态（对应HMM模型的一个状态）下的分布规律。
一段语音的生成过程：

HMM模型把发音过程抽象为一个状态序列。从初始状态一步步转移到结束状态，每次转移对应一个转移概率。
在进入某个状态后，以GMM模型为概率分布函数生成属于该状态的所有语音帧。每次语音生成过程都对应一个生成概率。

语音信号与模型的匹配程度：
给定一段语音，计算出由该模型生成该语音的概率。

四、N-Gram语言模型

作用：描述语言中词与词的搭配规律。
e.g. 3-Gram:
我/吃/水果0.1
我/吃/鱼0.2
… …

五、解码过程

解码本质：给定一段语音，在所有可能句子中搜索，找到和该语音最匹配的句子。（考虑两个因素：a. 声学模型对语音信号的生成概率；b. 语言模型给出的词间搭配概率。）
一般搜索策略：剪枝搜索

语音特征向量依次输入解码器；
每接收一个新的语音帧，解码器需要考虑加入一个新的音素或单词（搜索空间扩展）；
每次扩展后只保留当前匹配度最高的候选句子。

FST（提高解码效率）：将一个输入序列（语音帧序列）映射到输出序列（词序列），并将声学模型和语言模型的概率集成到这一映射过程中。

发布了37 篇原创文章 · 获赞 0 · 访问量 770

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_40680322/article/details/103425317

3.3 基于GMM-HMM的语音识别

语音识别-声学模型（GMM-HMM）

[语音识别] 05 基于GMM-HMM的语音识别系统

AI大语音（九）——基于GMM-HMM的连续语音识别系统

语音识别中GMM-HMM的相关知识

GMM-HMM语音识别模型原理篇

GMM-HMM在语音中的应用常识

语音识别学习记录 [GMM-HMM、DNN-HMM、MMI/BMMI/MPE/sMBR]

语音识别系统原理介绍---从gmm-hmm到dnn-hmm

语音识别基本原理介绍--gmm-hmm中训练的完整版

语音识别基本原理介绍之gmm-hmm续

AI大语音（八）——GMM-HMM声学模型

3.3创业风险识别

【NLP】语音识别 — GMM， HMM

语音识别基本原理介绍----gmm-hmm中的embedded training （嵌入式训练）

基于GMM—HMM的语音识别全过程

3.3

3.3 采用HMM算法进行分词

声学模型GMM-HMM训练

基于OMAPL：Linux3.3内核的编译

Android基于cordova3.3的插件开发

语音识别中HMM-GMM的训练过程

语音识别实践——第2、3章：GMM，HMM

Kaldi语音识别技术(六) ----- DTW和HMM-GMM

OpenCV3.3人脸识别模块的API的变化

基于DNN-HMM的语音识别技术

基于Annotation的Hibernate3.3+Spring2.5整合开发

基于vs2015+opencv3.3的简易的车牌定位

redmine3.3基于bitnami集成快速安装

Spring框架学习（3.3）基于@AspectJ注解的AOP实现

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)