云-短语音识别

短语音识别标准版这个东西比较常见,就比如微信上的语音转文字。 可以把对方发过来的语音直接转换成文字。一般是将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。

这个功能各大云厂都在做,一般的特点如下:

技术领先识别准确

采用领先国际的流式端到端语音语言一体化建模方法,融合百度自然语言处理技术,近场中文普通话识别准确率达98%。

多语种和多方言识别

支持普通话和略带口音的中文识别;支持粤语、四川话方言识别;支持英文识别。

深度语义解析

支持50多个领域的语义理解,如:天气,交通,娱乐等。还可接入智能对话定制与服务平台UNIT自定义语义理解和对话服务,让您更准确地理解用户意图。

中文标点智能断句

使用大规模数据集训练语言模型,根据语音的内容理解和停顿智能匹配合适的标点符号(包括,。!?),使识别结果的表现方式贴合表述,更加可懂。

数字格式智能转换

根据语音内容理解可以将数字序列、小数、时间、分数、基础运算符正确转换为数字格式,使得识别的数字结果更符合使用习惯,直观自然。

支持自助训练专属模型

支持在语音自训练平台上自助训练模型,上传词汇文本即可零代码完成训练,精准提升业务领域词汇识别率5-25%,并可专属使用。

不仅仅是开头说的语音,还有其他的应用场景:

语音输入

摆脱生僻字和拼音障碍,使用语音即时输入。略带口音的普通话、粤语四川话方言、英文,均可有效识别,并可根据句意自动纠错、自动断句添加标点,让输入更快捷,沟通交流更顺畅。

语音搜索

搜索内容直接以语音的方式输入,应用于网页搜索、车载搜索、手机搜索等各种搜索场景,解放双手让搜索更加高效,适用于视频网站、智能硬件、手机厂商等多个行业。

语音指令

无需手动操作,可以通过语音直接对设备或者软件发布指令,控制操作,适用于智能硬件、车载系统、机器人、手机APP、游戏等多个领域。

社交聊天

社交聊天时直接用语音输入的方式转成文字,让输入更加便捷;或者在收到语音消息不适合播放时可以转为文字进行查看,满足更多的聊天场景。

游戏娱乐

游戏中聊天必不可少,双手无法打字,语音输入可以将语音聊天转为文字,让用户在操作的同时也可直观看到聊天内容,多样化满足用户聊天需求。

猜你喜欢

转载自blog.csdn.net/m0_66194642/article/details/123735742
今日推荐