针对中英文code-switch语音识别的英文单词发音生成工具

为了快速构建中英文混合语音识别系统,一种简单的做法就是在中文ASR的发音词典中加入英文单词的映射发音,对此快捷V语音工作室推出了一个基于音素解码算法的英文单词发音生成器:

https://github.com/coolEphemeroptera/Foreign_Pronunciation_Generator_for_Code-Switch_ASR

例如获取英文单词office发音:

python generator.py office

然后服务器端返回解码结果:

OFFICE aa ao4 f ei3 s iy3
OFFICE aa ao4 f ei3 s iy5
OFFICE aa ao4 f ei4 s iy5
OFFICE aa ao4 f ei4 s iy3

解码得到的映射发音还是不错的,这些音素均为中文的声学单元(来自aishell的发音词典)

Guess you like

Origin blog.csdn.net/Ephemeroptera/article/details/121368959