Kaldi

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/heqiang525/article/details/78589391

关于kaldi

什么是kaldi?

kaldi 是一个基于C++编写的用于语音识别的工具箱,kaldi一般被用于进行语音识别的研究者和相关人士。

kaldi命名

   According to legend, Kaldi was the Ethiopian goatherder who discovered the coffee plant.(官网上这么写的)

kaldi和其他工具箱

   kaldi的目的和应用范围类似于HTK(较早的一种语音识别工具箱,详细介绍见网址http://htk.eng.cam.ac.uk/),kaldi的目标是拥有基于C++编写灵活和流行的代码,易于修改和扩展,也包括重要的特征。

 1、通过有限状态机(FSTs)进行代码集成

可以编译OpenFst工具包(使它成为一个库)

 2、广义的线性代数

包括一个矩阵库,它包括标准的BLAS和LPACK

3、可扩展设计

尽可能以简单的形式提供我们的算法,例如,我们的解码器是一个基于(框架,FST输入符号)元组评分索引的对象,这就意味着解码器可以适合任何数据源,如神经网络。

4、开放许可

该代码是在Apache2.0许可的,这是限制最少的许可证之一。

5、完整的知识谱

我们的目标是提供完整的构建语音识别系统的方法,这些工作可以广泛用于数据库,例如Linguistic Data Consortium(LDC)提供的数据。

开放完整的知识谱的目标是Kaldi的一个重要方面,在开发许可的背景下代码是公开的,允许修改和从新发布,我们希望大家可以发布自己的代码,类似于Kaldi的脚本示例。

在限制的时间内我们试图尽可能的完善Kaldi的文档,在短期内我们不能生成类似HTK完整的文档。尤其是现在有很多介绍HTK的材料,对于外行来说是系统的介绍语音识别,这将不可能出现在Kaldi的文档中。Kaldi的很多文件仅仅是以可以被专家接受的形式下编写的。在未来我希望它更容易获取,记住我们的目标对象是一些语音识别和正在接受训练的研究者。总的来说,Kaldi不是一个傻瓜式的语音识别工具,这将是你做了很多没有有意义的操作。

猜你喜欢

转载自blog.csdn.net/heqiang525/article/details/78589391