语音识别学习笔记(三)【动态时间归正的识别技术】

语音识别学习笔记(三)【动态时间归正的识别技术】

1.概述 
在语音识别中,简单的将输入模板和参考模板进行比较存在很大的缺陷,因为语音信号具有很大的随机性,即便是同一个人在不同时刻说同一句话,也不可能具有完全相同的时间长度,因此时间归正处理是必不可少的!动态时间弯折(Dynamic Time Warping,DTW)是把时间归正和距离测度计算结合起来的一种非线性归正技术,也是语音识别中的一种成功的匹配算法。 
DTW算法被广泛应用在孤立词识别中,但也存在以下问题: 
1)运算量大;2)过分依赖VAD;3)没用充分利用语音信号的时序动态信息。

2.DTW基本原理 
http://www.cnphp6.com/archives/60574

3.模板训练算法 
1)偶然模板训练法; 
2)顽健模板训练方法; 
3)聚类方法

猜你喜欢

转载自blog.csdn.net/zhangbijun1230/article/details/83420392
今日推荐