使用百度开发者平台处理语音朗读

--TIME

--百度开发者中心-汇聚、开放、助力、共赢

--注册账号

 -- 准备工作

准备工作

更新时间:2023-01-13

成为开发者

三步完成账号的基本注册与认证:

STEP1:点击进入控制台,选择需要使用的AI服务项。若为未登录状态,将跳转至登录界面,请您使用百度账号登录。如还未持有百度账户,可以点击此处注册百度账号

STEP2:首次使用,登录后将会进入开发者认证页面,请填写相关信息完成开发者认证。注:(如您之前已经是百度云用户或百度开发者中心用户,此步可略过。)

STEP3:通过控制台左侧导航,选择语音技术,进入语音技术的控制面板,进行相关操作。

BB4979E6-CF98-4639-BFAE-696361D6EE1F.JPG

领取免费额度

新用户使用语音技术可以在控制台领取相应接口的免费测试额度进行接口调用,免费额度有效期自领取成功之日开始计算,有效期截止后,免费调用额度清零。详情可点击此处查看 语音识别免费额度 | 语音合成免费额度 | 呼叫中心语音免费额度

微信截图_20221130182012.png

创建应用

您需要创建应用才可正式调用语音技术能力,应用是您调用服务的基本操作单元,您可以基于应用创建成功后获取的API Key及Secret Key,进行接口调用操作,及相关配置。您可按照下图所示的操作流程,完成创建操作。

微信截图_20221130182124.png

微信截图_20221130182151.png

应用名称: 用于标识您所创建的应用的名称,支持中英文、数字、下划线及中横线,此名称一经创建完毕,不可修改。

接口选择: 每个应用可以勾选业务所需的所有AI服务的接口权限(仅可勾选具备免费试用权限的接口能力),语音技术下全部接口已默认勾选,创建应用完毕,此应用即具备了所勾选服务的调用权限。

语音包名:如果您需要使用语音技术SDK服务(iOS/Android),需要绑定包名信息,以便生成授权License。

应用归属:可选择个人使用或公司使用服务,若为公司使用,可与专属商务经理沟通,获取专业的售前支持。

应用描述: 对此应用的业务场景进行描述。

获取密钥

在您创建完毕应用后,平台将会分配给您此应用的相关凭证,主要为AppID、API Key、Secret Key。以上三个信息是您应用实际开发的主要凭证,请您妥善保管。下图为示例内容:

image.png

生成签名

您需要使用创建应用所分配到的AppID、API Key及Secret Key,进行Access Token(用户身份验证和授权的凭证)的生成,方法详见 Access Token获取,我们为您准备了几种常见语言的请求示例代码。

温馨提示:Access Token的有效期为30天(以秒为单位),请您集成时注意在程序中定期请求新的token。

启动开发

目前语音技术主要有两种方式使用:API与SDK,您可以选择各产品的文档,查看具体使用方法及参数。详情可点击此处查看 语音识别导览 | 语音合成导览 | 呼叫中心语音导览

如何用可视化工具调用

更新时间:2023-01-13

如何使用 Postman 调用语音技术服务 API

本文提供了通过可视化工具 Postman 调用短文本语音合成 API 的样例,帮助您零编码快速体验并熟悉语音技术服务。

1. 下载并安装接口调用工具

1.1 下载接口调用工具 — Postman

下载地址如下:

Mac 下载地址,点击前往>>

Windows 下载地址,点击前往>>

1.2 Postman 安装教程

(1)双击安装包。

(2)初次登录无账号,可直接进入 postman 主界面。

2. 获取 Access Token

将请求格式改为 “POST” 并填写请求地址:https://aip.baidubce.com/oauth/2.0/token

微信截图_20221130185421.png

点击 Body,选择“x-www-form-urlencoded”,在 key 和 value 中分别输入以下3个请求参数。

grant_type: 必须参数,固定为 client_credentials

client_id: 必须参数,应用的 API Key

client_secret: 必须参数,应用的 Secret Key

微信截图_20221130185459.png

点击右上角蓝色“send”,即可在下方返回值区域中获取 access_token。

微信截图_20221130185603.png

3. 进行接口调用

3.1 接口调用 具体操作如下:

(1) 将请求格式改为 “POST” 并填写请求地址(以短文本语音合成为例):https://tsn.baidu.com/text2audio

微信截图_20221130190152.png

(2)点击 Body,选择“x-www-form-urlencoded”,在 key 和 value 中分别输入以下请求参数。

tex: 必须参数,合成文本

tok: 必须参数,获取到的access_token参数

cuid: 必须参数,用户唯一标识

ctp: 必须参数,客户端类型选择,web端填写固定值 1

lan: 必须参数,固定值 zh

(更多参数请到短文本语音合成页面查看)

微信截图_20221130190448.png

(3) 修改请求头,点击 Headers,在 key 和 value 中分别输入1个请求参数。

key 栏输入:Content-Type

value 栏输入:application/x-www-form-urlencoded

微信截图_20221130190958.png

(4)点击右上角蓝色“send”,即可在下方返回值区域中获取音频。

微信截图_20221130190455.png

语音识别SDK

更新时间:2023-01-13

Android SDK快速集成指南

只需四步,即可完成语音识别SDK的应用集成,让您的应用获得稳定一致的识别体验。

Step1:成为百度AI开放平台的开发者

要调用百度AI开放平台的语音识别能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者,并新建一个百度语音识别应用。

1. 创建帐户

点击此处注册百度账户,快速建立一个百度账号,请参考下图: 

屏幕截图 2021-12-29 144649.png

2. 创建应用

创建账号之后,登录百度AI开放平台,并且点击此处创建一个应用,如下图:

创建APP1.png

创建应用时请务必输入应用名称、语音包名(输入示例demo包名:com.baidu.speech.recognizerdemo)等信息,创建完成后就可以看到创建的应用信息了:

创建APP2.png

创建完成的应用信息如下图所示:

APP3.png

Step2:申请语音识别额度

1. 实名认证

语音识别SDK需要完成实名认证后才能使用,第一步需要按照提示完成个人认证或企业认证。完成实名认证的用户可以领取免费额度。如下图所示进行实名认证: 

实名认证.png

2. 领取免费额度

完成实名认证后,需领取语音识别的免费额度。如下图所示:

领取免费额度.png

Step3:下载语音识别SDK,填写授权信息

1. 获取鉴权信息

准备好创建应用后获取到的3个鉴权信息,AppID、API Key、Secret Key,需要您登陆控制台查看应用详情获取。

2. 下载语音识别SDK

在SDK下载页面下载 语音识别Android SDK 文件,链接:SDK下载_文字识别SDK_语音识别SDK-百度AI开放平台

3. 不修改SDK,直接运行

解压sdk文件,不做任何修改,直接安装运行程序可以看到以下界面:

安卓修改1.png

4. 填写鉴权信息

填入 AppID、API Key、Secret Key 3个鉴权信息测试,请按照以下步骤全部修改:

修改参数.JPG

Step4: 测试语音识别功能

1. 按照上述文档修改完成后,安装app打开后进入在线识别,点击开始录音可进行在线语音识别:

安卓修改2.png

简单的 语音识别Android SDK 测试完成了,其他各子功能可以按照详细的技术文档进行集成。


 

iOS SDK快速集成指南

只需四步,即可完成语音识别SDK的应用集成,让您的应用获得稳定一致的识别体验。

Step1:成为百度AI开放平台的开发者

要调用百度AI开放平台的语音识别能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者,并新建一个百度语音识别应用。

1. 创建帐户

点击此处注册百度账户,快速建立一个百度账号,请参考下图: 

屏幕截图 2021-12-29 144649.png

2. 创建应用

创建账号之后,登录百度AI开放平台,并且点击此处创建一个应用,如下图:

创建APP1.png

创建应用时请务必输入应用名称、语音包名(输入示例demo包名:com.baidu.speech.BDSClientSample)等信息,创建完成后就可以看到创建的应用信息了:

ios包名创建.png

创建完成的应用信息如下图所示:

iosapp2.png

Step2:申请语音识别额度

1. 实名认证

语音识别SDK需要完成实名认证后才能使用,第一步需要按照提示完成个人认证或企业认证。完成实名认证的用户可以领取免费额度。如下图所示进行实名认证: 

实名认证.png

2. 领取免费额度

完成实名认证后,需领取语音识别的免费额度。如下图所示:

领取免费额度.png

Step3:下载语音识别SDK,填写授权信息

1. 获取鉴权信息

准备好创建应用后获取到的3个鉴权信息,AppID、API Key、Secret Key,需要您登陆控制台查看应用详情获取

2. 下载语音识别SDK

在SDK下载页面下载 语音识别IOS SDK 文件,链接:SDK下载_文字识别SDK_语音识别SDK-百度AI开放平台

3. 填写鉴权信息

填入 AppID、API Key、Secret Key 3个鉴权信息测试,请按照以下步骤全部修改:

IOS鉴权修改.png

Step4: 测试语音识别功能

1. 按照上述文档修改完成后,安装app打开后可进行在线语音识别:

ios识别.png

简单的 语音识别IOS SDK 测试完成了,其他各子功能可以按照详细的技术文档进行集成。

百度AI开放平台 语音文档~

猜你喜欢

转载自blog.csdn.net/s_sos0/article/details/134792854