语音服务技术支持之——命令词识别

一、能力介绍
命令词识别,即语音识别 (Auto Speech Recognize, ASR)技术,主要指基于命令词的识别,识别指定**组合的词汇,或者固定说法的短句。
 
二、常见答疑:
1. 离线语音服务与在线语音服务有哪些区别?
离线语音服务和在线语音服务的主要区别在开发包大小、合成效率、合成效果方面。
(1)开发包大小:离线SDK包比在线SDK包要大,因为前者计算在本地,而后者在云端;
(2)合成效率:离线服务核心计算在本地,减少了网络交互的时间,相比在线服务响应快;
(3)合成效果:由于本地计算能力和存储空间的限制,离线资源相对小点,但同时保证离线服务效果,可以通过下载集成免费的体验包来抢先体验效果。
 
 
2.离线命令词识别支持多少命令词?
离线识别的命令词是开发者自己定义,命令词最大长度为31个字,个数为215个。需要先构建语法,然后指定使用的语法。语法文件开发文档请参考识别语法分享--在线语法和离线语法编写指南。简单的语法示例如下:
例如,开发一个简单的语音拨号应用,可定义如下语法:
. . . . . .
<commands>|找一下|打电话给) <name>;
<name>: 张三|李四;
. . . . . . .
该语法使识别引擎可以支持以下说法:找一下张三 、打电话给张三 、找一下李四 、打电话给李四。
凡是用户说出这个范围中的任意一句话,均可以被识别系统识别。如果用户说的话不在上述范围中,识别系统可能拒绝识别。
 
3. 装机量是怎么定义的?
装机量授权:离线命令词识别按照装机量收费,购买后即获得相应授权。装机量按照使用了开发者应用的终端设备信息进行统计,即在终 端设备上安装了应用并启用了离线引擎,即记为一个装机量。同一个终端设备上卸载(重装)应用均记为同一个装机量,不重复计数。
4.错误码查询
常见错误码查询如下: https://shimo.im/sheet/w3yUy39uNKs0J7DT, 如果未能解决您的问题,可以在工单系统/论坛提问。
 
5. 在线命令词abnf语法示例
 
 

猜你喜欢

转载自www.cnblogs.com/catherine9192/p/9187871.html
今日推荐