科大讯飞语音识别SDK的ROS包修改

企业开发 2023-04-07 05:43:00 阅读次数: 0

语音识别の目录

一、科大讯飞平台下载开放包及语音验证
二、ROS环境下的语音识别与输出
总结

一、科大讯飞平台下载开放包及语音验证

提示：本文针对的是语音识别中的语音识别（流式版）
讯飞平台：链接传送门
需要先注册账号，然后创建自己的应用才能够对开放包进行下载（每个开放包都有自己的APPID号，这个很重要！）

创建应用的界面

下载的包

将开放包下载到linux系统中
在这里插入图片描述
这是包中各个文件及其里面的内容

重点要用到的是samples里面的这些包

进入iat_online_record_sample功能包下，执行.sh脚本文件进行编译

在这里插入图片描述

二、ROS环境下的语音识别与输出

1.ROS语音识别

首先在工作空间下，建立语音识别的ROS功能包
工作空间如何创建？链接传送门
在这里插入图片描述
执行完指令后，框架如下，include包含科大讯飞程序的头文件，src包含引用科大讯飞接口的ROS代码

这块是不需要修改的。

主函数

代码块完成之后，就是对Cmakelist进行修改了

然后对工作空间下的robot_voice进行编译，也可以单独编译
在这里插入图片描述
最后进行语音识别的测试

2.ROS语音输出

把科大讯飞平台提供的语音输出功能包中的.c文件放到robot_voice_824/src文件夹中，并改名为tts_subscribe.cpp
在这里插入图片描述

subscriber：订阅/voiceWords话题接受输入字符串。
回调函数：使用SDK接口将字符串转换成语音。

在这里插入图片描述
修改Cmakelist
在该文件下添加以下编译规则：

在这里插入图片描述
最后是ROS语音输出编译

语音输出演示

3.ROS语音识别与输出

多节点，配置launch文件
在这里插入图片描述

4.ROS语音交互

每一个.cpp代表一个节点，创建语音交互的节点

在这里插入图片描述
在原来的回调函数中增加以下代码

保存cpp并在Cmakelist增加新的编译规则

catkin_make：编译语音相关功能包

编写launch文件：打开语音识别节点和语音助手节点

在终端执行roslaunch robot_voice_824 voice_assistant.launch

总结

以上就是关于科大讯飞语音识别SDK的ROS包修改。在资源里，有笔者现成的ROS功能包，直接在工作空间下，便能运行，但是需要注意APPID的修改。链接传送门
如有侵权，请及时与笔者联系。//抱拳

猜你喜欢

转载自blog.csdn.net/m0_49960034/article/details/128062851

科大讯飞语音识别SDK的ROS包修改

ROS 科大讯飞语音（三）识别篇

科大讯飞语音SDK下载及测试

Android 集成科大讯飞语音识别

科大讯飞语音识别服务

ionic科大讯飞语音识别

Android 科大讯飞语音识别

科大讯飞语音识别Demo创建

web科大讯飞语音识别webapi

科大讯飞语音识别测试

科大讯飞语音离线命令识别

利用科大讯飞语音合成模块SDK实现ROS语音交互

ROS应用 —— Ubuntu16.04下科大讯飞语音合成的修改&使用（3)

ROS应用 —— Ubuntu16.04下科大讯飞语音听写的修改&使用（2）

android语音识别之科大讯飞语音API的使用

Android 集成科大讯飞语音并实现语音识别

ROS实战（二）科大讯飞语音合成模块

ROS 科大讯飞语音（一）环境搭建与准备

ROS科大讯飞语音（二）说话篇

3、科大讯飞语音开发--产品SDK下载

集成科大讯飞语音合成Android SDK遇到的坑

Python调用科大讯飞语音听写的SDK包

科大讯飞语音播报

科大讯飞语音识别集成与封装

Android 科大讯飞语音识别(详细步骤+源码)

UE4：科大讯飞语音识别

讯飞语音识别

讯飞语音识别SDK集成语音识别语音合成讯飞英语识别

SDK（3）讯飞语音

讯飞语音识别库

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)