phoneme:音标,发音的基本单位,lexicon:词表,Grapheme:书写的基本单位,26个字母
蓝色框是rnn,
最小发音单位,他的分布是固定的,发音是固定的
相当于用deeplearning生成了word2vec,不用mfcc
align就是mfcc和ab对应的关系,所有可能的概率之和。
通过下面方式穷举所有的可能,求和来作align。
phoneme:音标,发音的基本单位,lexicon:词表,Grapheme:书写的基本单位,26个字母
蓝色框是rnn,
最小发音单位,他的分布是固定的,发音是固定的
相当于用deeplearning生成了word2vec,不用mfcc
align就是mfcc和ab对应的关系,所有可能的概率之和。
通过下面方式穷举所有的可能,求和来作align。