5.16-在线词识别程序学习(ASR+IAT)

一些信息

6.bin文件夹是调试路径,里面文件的作用如下:

  msc.dllWIN32平台程序必需的动态库;

  msc_x64.dllx64平台程序必需的动态库;

  msc.cfg包含了配置信息,调试、测试时不需改动,发布产品后可以将倒数第五行的“output=1”改为“output=0”,“output=1”时会输出运行日志到msc.log,在调试时出现问题可以发给我们帮助你分析,“output=0”时会关闭日志输出,为用户节省磁盘空间;

  asr_keywords_utf8.txtasrdemo中用到的命令词列表,编码为UTF8,对其内容进行修改时,请不要用系统自带的记事本程序,建议使用Notepad++UltraEdit等文本编辑软件;

  gm_continuous_digit.abnfasrdemo_with_abnf中用到的语法文件,编码为GB2312,对其内容进行修改时,请参照doc文件夹下的《语法开发指南》;

  wav文件夹里面都是事先准备好的录音文件,分别用于asrdemoasrdemo_with_abnfiatdemoiatdemo_with_multi-result

  当运行过样例程序之后,还会生成一个以md5值为名的文件夹,其中保存的文件内容是程序运行中记录的性能信息和错误信息,将会上传到服务器,有利于我们改善服务质量,请不要删除。

7.新增iatdemo_with_user_vocabulary(上传用户词表demo),关键词上传后,当次会话没有效果,云端需要一段时间对关键词表进行激活,稍后才能正常使用。

iat(语音听写)和asr(语音识别)均可以上传用户词列表,但目前不知道其区别。

ASR上传命令词程序学习

TXT文件中添加关键词,重新上传获得GID,只需上传一次即可,记住ID,以便以后使用,若添加了新关键词,则需重新上传获得ID

若列表中没有这个词语,则显示结果与此类似:

The result is: confidence=91 grammar=0 id=nomatch name=nomatch:out-of-vocainput=nomatch:out-of-voca

对“喂你好我是一名大学生”添加不同种类关键词的影响

添加整句话,识别率高,效率低

长传新的词表后"科大讯飞"被识别为"歌华有线",此表中两个词语同时存在,"歌华有线"删除,重新上传,"科大讯飞"识别为"葛洲坝",4,5均无法识别,不知道激活时间有多长

经过一天等待,情况没有改善,应该仔细审读程序,消除Grammar的问题。

调整压缩比等上传参数,使得识别效果和消耗时间指标比较均衡

 

科大讯飞语音功能小结

科大讯飞的示例demo比较炕爹,它必须在你申请的appid基础上运行,否则会出错哦!也就是你必须申请appid,然后才能下载示例demo,很炕爹吧!

 

这里我就不多余重复开发文档中的了,说一些自己的理解:

1.我之前有一个想法,就是科大讯飞在语音识别的时候,需要你上传命令词,词表或者联系人,我们可以在注册开发者的时候在自己的信息中上传自己的词库,然后我们在程序中只需要通过登录来获取一个标示token什么的,这样的话,如果你的词库发生变化了,就不需要更改代码了,只需要在自己的开发者信息下重新上传一下,不用更改程序了,科大讯飞的技术支持的回复是web端没有提供这个接口,他们的回复是:我们可以申请一个web端的appid,然后在自己的服务器上做这样的处理

2. 词表和联系人在上传的时候没有返回grammerID,在语音识别的时候需要登录,上传一次;命令词和abnf语法上传也是上传一次,但是这里会回复一个grammerID这样就需要在语音识别的时候传参。

3.命令词和词表的区别在于:

     命令词:语音识别的时候会只在命令词的范围内搜索

     词表:语音识别优先从词表中搜索

4.在添加的框架中如果是在ios5系统下ADSupport.framework要设为optional

5.如果想要自定义UI则须参考无UIdemo,然后在- (void) onVolumeChanged: (int) volume;这个回调里面随着语音的音量大小来切换图片

6.grammerID可以跨平台使用 

 

Inserted from <http://blog.csdn.net/mdk132/article/details/17004905>


猜你喜欢

转载自www.cnblogs.com/lizhensheng/p/11241940.html
今日推荐