语音识别学习笔记(三)【动态时间归正的识别技术】
1.概述
在语音识别中,简单的将输入模板和参考模板进行比较存在很大的缺陷,因为语音信号具有很大的随机性,即便是同一个人在不同时刻说同一句话,也不可能具有完全相同的时间长度,因此时间归正处理是必不可少的!动态时间弯折(Dynamic Time Warping,DTW)是把时间归正和距离测度计算结合起来的一种非线性归正技术,也是语音识别中的一种成功的匹配算法。
DTW算法被广泛应用在孤立词识别中,但也存在以下问题:
1)运算量大;2)过分依赖VAD;3)没用充分利用语音信号的时序动态信息。
2.DTW基本原理
http://www.cnphp6.com/archives/60574
3.模板训练算法
1)偶然模板训练法;
2)顽健模板训练方法;
3)聚类方法