树莓派语音识别(一)我的想法与计划

前言:我最近在弄树莓派语音识别,国内有个大佬弄得那个叮当实验室(https://shumeipai.nxez.com/2017/07/02/dingdang-an-open-source-chinese-smart-speaker-project.html)挺有意思,实际上他是基于国外的Jasper 项目,其实市面上广为流通的语音识别技术大多数是从开源PocketSphinx语音识别系统发展来的。我并不想抄袭叮当实验室的东西,我想从根源上开始学习,研究算法本身,搞明白它是怎么回事,然后开发自己的语音识别技术。我的目的是学习而不是完成什么急功近利的目标。看起来很有志向是不是,哈哈哈,我也是刚刚开始的啦,蚂蚁啃骨头,一点点来吧。

我的计划:

语音助手,初步先做一个控制设备B点灯(后续还可一添加一些,譬如查询天气预报,点歌等)。要具备语音唤醒和语音识别功能。离线语音唤醒采用pocketsphinx(开源项目),用python来做,参考github;语音识别基于百度云,到百度ai网站上找,参照它说的做,github上也有示例代码。譬如唤醒词“baby”,控制词“light up”。首先调用pocketsphinx的api来监听唤醒词,识别后给人一个回应,譬如发出叮的一声;然后开始在线语音识别(就是录了音发给百度云,然后接收百度云的结果)(stt,sound to text),将接收到的结果跟“light up”匹配,匹配上了通过wifi给arduino发信息让他点灯。外手机app可以通过mqtt远程查看灯的开关状态,控制灯的开关。

硬件选择:

1. Raspberry Pi 4(最新),小伙伴们用3B也行

2. 麦克风初步选用树莓派标配的ReSpeaker 4-Mics Pi HAT 它是四麦克风阵列的,比较适合树莓派做语音识别那块。

3. 有新的再添加

。。。。。。

下面我们进入,正题,请转到第一篇,ReSpeaker 4-Mics Pi HAT 的安装与测试。

猜你喜欢

转载自blog.csdn.net/Smile_h_ahaha/article/details/106369710