语音识别之HTK入门(二)准备训练数据

语音识别之HTK入门(二)准备训练数据

识别过程是隐马尔可夫模型HMM进行的
在这里插入图片描述
HTK说到底就是建立隐马尔可夫模型HMM过程中的工具,过程如下:在这里插入图片描述M的工具,如下图:

文件目录树构建

构建一个目录框架,创建命令如下:

mkdir -p htk_color/{config,data/{test/{mfc,speech},train/{mfc,speech}},dict,hmm0,hmm1,hmm2,hmm3,hmm4,hmm5,hmm6,hmm7,labels,lists,results,scripts}

查看命令及结果:

tree -d htk_color

在这里插入图片描述
构建完成后,以后的命令都是在此文件夹下运行终端。

语音数据采集

Linux下安装音频录放工具sox,命令如下:

sudo apt-get install sox

安装完成后,运行命令进行录音:

rec -b 8 data/train/speech/01.wav

Ctrl+c结束录音,依次输入命令进行语音数据采集即可
通过以下命令播放录音结果:

play data/train/speech/01.wav

在这里插入图片描述
收集数据的过程,是一个十分折磨人的工作,语音文件的收集更是难办,搭建一个效果好的语音模型,你不仅需要一个人的语音,你还需要其他人的语音,过程很艰巨,慢慢体会,比图像的收集要麻烦多,但是用数量很少的样本,也可以训练出相对准确的结果。
接下来我用了十个录音文件进行了尝试,到此数据集的准备已经完成,下一节完成训练过程的配置。

发布了27 篇原创文章 · 获赞 17 · 访问量 4159

猜你喜欢

转载自blog.csdn.net/weixin_44747240/article/details/104155422