2020-4|语音信号的预处理
其他
2020-04-12 17:08:17
阅读次数: 0
分帧
- 原因:由于发生器官的惯性运动,可以认为在一小段时间里语音信号近似不变,即语音信号是短时平稳的,因此可以把语音信号分为一些短段进行处理,也就是分帧。
- 方法:采用可移动的有限长度窗口加权
- 参数:
帧长 wlen
帧移 inc前后帧的交叠部分长度;一般帧移/帧长=0~0.5
帧数 Nframe (数据长度-(帧长-帧移))/帧移;一般每秒帧数为33~100帧
- 实现:enframe(x,win,inc)
加窗
- 原因:分帧是采用可移动有限长度的窗口进行加权实现的,因此带来了窗函数的选择问题。
- 原理:窗函数一般具有低通特性,不同的窗函数有不同的带宽和频谱泄漏。
- 对比:
名称 |
主瓣宽度/频谱分辨率 |
旁瓣宽度/频谱泄漏 |
优点 |
汉明窗 |
大/低频谱分辨率 |
小/频谱衰减不严重 |
有低通特性,更好反映短时信号频率特征 |
矩形窗 |
小/高频谱分辨率 |
大/频谱泄漏严重 |
|
合成
用频谱参数合成语音信号OverlapAdd2
- 功能:把频域中一帧帧的频谱幅值参数和相位参数 合成为连续的语音信号
发布了14 篇原创文章 ·
获赞 0 ·
访问量 575
转载自blog.csdn.net/weixin_44618426/article/details/104387385