45K月薪的Python大咖实现语音密钥,华为欲花百万年薪聘请,转身被拒!

阐述

QQ/微信上有一个功能是提取图片中的文字,这就算是文字识别,同时也是图像识别,其中并没有严格的界限,只有复杂与更复杂的差别,同时也有文字转化为语音。也经常有在网上看到Python文字识别,图像、场景识别等各类教程。我觉得Python既然如此强大,那么能不能再来点更加特别的?

文字识别+人脸识别

如题所述,难度高点的就是用python把语音识别为文字,脑洞再打开点,如果可以音色识别,是不是可以实现芝麻开门的效果,把你的一段语音打造成一段密钥?就同人脸识别,指纹识别一样

芝麻开门密语

好吧,这个对于我们来说还有点难,我们暂且只能追求更加精准的识别我们所说的语音,毕竟我的普通话就非常的不标准。同时让它变得更加强大点,识别英语,然而我非常喜欢黄家驹,那么我还要叫python能够帮我识别粤语。

会唱歌的程序员

下行接口定义

识别成功返回case

  1. {\"err. no\":0,\"err_ msg\":\"success.\",\"corpus_ no\":\"15984125203285346378\",\"sn\":\"481D633F-7

3BA-726F -49EF -8659ACCC2F3D\",\"result\":[\"北京天气\"]}

识别错误返回case

  1. {"err_ no" :2000,"err. msg" :"data empty.","sn" :null}

错误码解释、错误码含义

3300,输入参数不正确、3301,识别错误、3302,验证失败、3303,语音服务器后端问题、3304,请求GPS过大,超过限额、3305,产品线当前日请求数超过限额

Python实现过程

  1. 登陆百度语言,获取 APIkey、SecretKey.

  2. 利用pyaudio实现录音部分,生成Wav文件。

  3. 利用Pycurl扩展包上传百度语音识别,并返回case。

Python源码:

Python代码

学海无涯,不知何时才能够自己用Python实现语音密码的效果。

文|Python新世界/最优美的编程语言

猜你喜欢

转载自www.cnblogs.com/tzjks/p/9140023.html