利用百度API进行语音的识别

程序开发环境:WIN 7 , 64位计算机,PyCharm编译器

在利用百度API进行语音识别应用之前,要在百度官网注册成为开发者。注册网址为:http://yuyin.baidu.com/asr

在成为了开发者后,创建语音识别的应用,应用创建完成后如下所示。


此时,我们需要获取到应用所需要的key,只有拥有了key才能够进行语音信号的请求。点击查看key可以看到自己的两个值,这两个值如下所示:


此时我们需要的值已经拥有,进行语音的识别。语音识别通过json的格式将本地参数传到指定的网址,进行解析,结果为字符串类型,通过对字符串进行处理,得到最后的结果。首先定义token,在该函数中定义上传的地址,api_keyi,secret_key,将数据组合成json的格式,采用request的方式进行提交。


接下来定义识别函数,识别函数主要是定义上传文件的格式。


特别需要说明的是,在r.test中返回了请求后的数据,该数据为字符串类型,如下面的例子:


返回的字符串包括五个字段,其中“result”字段是识别的结果,此时需要对字符串进行处理,从而可以提取出result的数值。通过对字符串进行分析,发现可以以‘,’进行分割,取出第四个数值,结果为,此时再利用‘:’进行分割,取出第二个就是结果。

定义完以上的函数之后,编写如下的代码。进行识别。


其中rate是语音的频率,如果不一样,识别结果会出现问题。

猜你喜欢

转载自blog.csdn.net/qq_34258054/article/details/80324786