基于百度AI平台的语音识别功能开发-SDK调用

一.前期工作

1.拥有一个百度智能云账号
2.创建一个语音应用,创建成功后会显示有一个应用

在这里插入图片描述3.在应用列表里查看自己的应用
在这里插入图片描述强调:
这里的AppID、API Key、Secret Key 很重要
百度除了语音识别等其余的api调用也离不开这三个重要的参数。

二、调用百度语音SDK,基于python3

操作流程:
1.下包
我使用的是pip install baidu-aip

在这里插入图片描述
2.新建AipSpeech

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

3.配置AipSpeech(一般不需要)

4.请求说明
以识别本地语音文件为例,假设本地有个语音文件是audio.pcm:

# 读取文件
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 识别本地文件
client.asr(get_file_content('audio.pcm'), 'pcm', 16000, {
    
    
    'dev_pid': 1537,
})

注意:
1.本地语音文件的后缀名要和后面的参数一一对应
2.音频的采样率固定为16000/8000,不符合此采样率的音频识别不出来
3.语音文件的格式支持pcm / wav / amr

// 成功返回
{
    
    
    "err_no": 0,
    "err_msg": "success.",
    "corpus_no": "15984125203285346378",
    "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D",
    "result": ["北京天气"]
}

// 失败返回
{
    
    
    "err_no": 2000,
    "err_msg": "data empty.",
    "sn": null
}

更多详情请见
百度语音识别官网技术文档(https://cloud.baidu.com/doc/SPEECH/s/1k4o0bmc7)

猜你喜欢

转载自blog.csdn.net/qq_49821869/article/details/109635921
今日推荐