基于DNN-HMM的语音识别技术

DNN-HMM声学模型与传统的基于GMM-HMM的声学模型相比,唯一的不同点在于用DNN替换了GMM来对输入语音信号的观察概率进行建模。DNN与GMM相比具有如下优点:

1、DNN不需要对声学特征所服从的分布进行假设;

2、DNN的输入可以采用连续的拼接帧,因而可以更好地利用上下文的信息;

3、DNN的训练过程可以采用随机优化算法来实现,而不是采用传统的批优化算法,因此当训练数据规模较大时也能进行非常高效的训练,显然,训练数据规模越大,所得到的声学模型就越精确,也就越有利于提高语音识别的性能;

4、在发音模式分类上,DNN这种区分式模型也要比GMM这种产生式模型更加合适。

猜你喜欢

转载自www.cnblogs.com/liuerdou/p/11279874.html