5.16-在线词识别程序学习（ASR+IAT）

一些信息

6.bin文件夹是调试路径，里面文件的作用如下：

msc.dll是WIN32平台程序必需的动态库；

msc_x64.dll是x64平台程序必需的动态库；

msc.cfg包含了配置信息，调试、测试时不需改动，发布产品后可以将倒数第五行的“output=1”改为“output=0”，“output=1”时会输出运行日志到msc.log，在调试时出现问题可以发给我们帮助你分析，“output=0”时会关闭日志输出，为用户节省磁盘空间；

asr_keywords_utf8.txt是asrdemo中用到的命令词列表，编码为UTF8，对其内容进行修改时，请不要用系统自带的记事本程序，建议使用Notepad++或UltraEdit等文本编辑软件；

gm_continuous_digit.abnf是asrdemo_with_abnf中用到的语法文件，编码为GB2312，对其内容进行修改时，请参照doc文件夹下的《语法开发指南》；

wav文件夹里面都是事先准备好的录音文件，分别用于asrdemo、asrdemo_with_abnf、iatdemo、iatdemo_with_multi-result；

当运行过样例程序之后，还会生成一个以md5值为名的文件夹，其中保存的文件内容是程序运行中记录的性能信息和错误信息，将会上传到服务器，有利于我们改善服务质量，请不要删除。

7.新增iatdemo_with_user_vocabulary（上传用户词表demo），关键词上传后，当次会话没有效果，云端需要一段时间对关键词表进行激活，稍后才能正常使用。

iat（语音听写）和asr（语音识别）均可以上传用户词列表，但目前不知道其区别。

ASR上传命令词程序学习

在TXT文件中添加关键词，重新上传获得GID，只需上传一次即可，记住ID，以便以后使用，若添加了新关键词，则需重新上传获得ID

若列表中没有这个词语,则显示结果与此类似:

The result is: confidence=91 grammar=0 id=nomatch name=nomatch:out-of-vocainput=nomatch:out-of-voca

对“喂你好我是一名大学生”添加不同种类关键词的影响

添加整句话,识别率高,效率低

长传新的词表后"科大讯飞"被识别为"歌华有线",此表中两个词语同时存在,将"歌华有线"删除,重新上传,将"科大讯飞"识别为"葛洲坝",4,5均无法识别,不知道激活时间有多长

经过一天等待，情况没有改善，应该仔细审读程序，消除Grammar的问题。

调整压缩比等上传参数,使得识别效果和消耗时间指标比较均衡

科大讯飞语音功能小结

科大讯飞的示例demo比较炕爹，它必须在你申请的appid基础上运行，否则会出错哦！也就是你必须申请appid，然后才能下载示例demo，很炕爹吧！

这里我就不多余重复开发文档中的了，说一些自己的理解：

1.我之前有一个想法，就是科大讯飞在语音识别的时候，需要你上传命令词，词表或者联系人，我们可以在注册开发者的时候在自己的信息中上传自己的词库，然后我们在程序中只需要通过登录来获取一个标示token什么的，这样的话，如果你的词库发生变化了，就不需要更改代码了，只需要在自己的开发者信息下重新上传一下，不用更改程序了，科大讯飞的技术支持的回复是web端没有提供这个接口，他们的回复是：我们可以申请一个web端的appid，然后在自己的服务器上做这样的处理

2. 词表和联系人在上传的时候没有返回grammerID，在语音识别的时候需要登录，上传一次；命令词和abnf语法上传也是上传一次，但是这里会回复一个grammerID这样就需要在语音识别的时候传参。

3.命令词和词表的区别在于：

命令词：语音识别的时候会只在命令词的范围内搜索

词表：语音识别优先从词表中搜索

4.在添加的框架中如果是在ios5系统下ADSupport.framework要设为optional

5.如果想要自定义UI则须参考无UI的demo，然后在- (void) onVolumeChanged: (int) volume;这个回调里面随着语音的音量大小来切换图片

6.grammerID可以跨平台使用

Inserted from <http://blog.csdn.net/mdk132/article/details/17004905>

5.16-在线词识别程序学习（ASR+IAT）

猜你喜欢