新知mfcc语音识别esp8266继电器开关灯(成为一个DIYer,四)

这次我们改变方式,文字艰难,我们先上图,看的多了,懂了,有兴趣,再看代码,mfcc语音识别讲的人已经很多了,我们实操,前面我们已经讲过声音采集,所以这里直接上图,开灯,‘开’这个音的波形和mfcc识别的结果,以及关灯,‘关’音的波形和mfcc识别结果,我们使用8kbyte采样每秒的录音,而有效的‘开’音和‘关’音,2048byte就够用了,由于显示的原因,我分幅图*1024=2048来显示一个音:

第一个开,发音:

第二个开,发音:

第三个开,发音识别:

第四个开,发音识别:

第五个开,发音识别:

够了吧,不够,告诉我,我还有,下面是:

第一个关,发音识别:

第二个关,发音识别:

第三个关,发音识别:

第四个关,发音识别:

第五个关,发音识别:

好像也够了,够观察,就说明问题,五幅‘开’图,个个不同,但‘开’字是相同的,mfcc获取的这些零,真他妈的好看!你是怎么做到的?他们能形成一定的格局(模式?),‘关’也一样,这就是mfcc诱惑人的地方。

他们说,mfcc一般取十三个数字特征,第一个不用,为什么?我看了非常多,有一个猜测,是直流的原因吗?(感觉很像傅里叶展开第一常数项a0)

其实这些零,大多是负数,看的人头疼,观察很久后,我想你也会这么做的,什么是归一化,我想,这就是我粗暴的归一化,世界终于清静了,天地澄明,特征美好,万物条理。

你有兴趣mfcc,我就继续展开他。下一节待续。。。

发布了66 篇原创文章 · 获赞 12 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/ganggangwawa/article/details/104349453