主要参考:
1). https://blog.csdn.net/luodongri/article/details/80100297
2). https://distill.pub/2017/ctc/,及其中文版https://www.zhihu.com/question/47642307
1.ctc 的损失函数是概率,而神经网络里面的损失函数,都是目标值和网络输出的l2算式,为什么ctc可以用概率作为损失函数?(5分)
ctc 的目标是对于给定X, 输出目标序列,而目标序列对应多个有blank的序列,所以只要目标序列输出概率最大,就可以作为网络的目标,即其取最小值就可以做为损失函数
2.输入X长度为6,ctc输出目标为cat,请写出至少4个可能的对齐方式 (5分)
相邻相同字母中间必须加blank,否则认为是一个,发音跨越了两帧
c, blank, a, blank, t,blank
c,blank,a,a,blank,t
blank,c,c,blank,a,t
c,blank,a,blank,blank,t
3.上题一共有多少种对齐方式(7分, 不好做)
去掉最后一帧,剩下前面5帧,从5帧里面,选取3步发生转向,5*4*3/(3*2*1) = 10
4.解释这个公式。(5分)