变量定义
1.warping function
其中
表示两个语音特征序列A和B之间的映射关系。
2.time-normalized distance
其中
warping function的限制条件
1.单调性
2.连续性
由以上两个条件限制了只能向三个方向移动,向上/向右/向右上,而且每次只能移动一步
3.边界条件
4.窗口限制
加窗为了将对齐路径限制在对角线附近。
5.斜率限制
避免在横轴i方向或纵轴j方向走的太偏,当在一个方向走了m步以后,需要在对角线方向走n步。
权重系数w
有两种典型的计算方式
1.对称形式
2.非对称形式
在j方向也一样。
对称形式的效果更好。
DP求解
假设使用对称形式的权重系数,不使用斜率限制
- 初始条件
- DP
其中窗口限制条件
- 距离
算法流程图如下:
Reference
Dynamic Programming Algorithm Optimization for Spoken Word Recognition