为了快速构建中英文混合语音识别系统,一种简单的做法就是在中文ASR的发音词典中加入英文单词的映射发音,对此快捷V语音工作室推出了一个基于音素解码算法的英文单词发音生成器:
https://github.com/coolEphemeroptera/Foreign_Pronunciation_Generator_for_Code-Switch_ASR
例如获取英文单词office发音:
python generator.py office
然后服务器端返回解码结果:
OFFICE aa ao4 f ei3 s iy3
OFFICE aa ao4 f ei3 s iy5
OFFICE aa ao4 f ei4 s iy5
OFFICE aa ao4 f ei4 s iy3
解码得到的映射发音还是不错的,这些音素均为中文的声学单元(来自aishell的发音词典)