2020-4|语音信号的预处理

分帧

  • 原因:由于发生器官的惯性运动,可以认为在一小段时间里语音信号近似不变,即语音信号是短时平稳的,因此可以把语音信号分为一些短段进行处理,也就是分帧。
  • 方法:采用可移动的有限长度窗口加权
    在这里插入图片描述
  • 参数:
    帧长 wlen
    帧移 inc前后帧的交叠部分长度;一般帧移/帧长=0~0.5
    帧数 Nframe (数据长度-(帧长-帧移))/帧移;一般每秒帧数为33~100帧
  • 实现:enframe(x,win,inc)

加窗

  • 原因:分帧是采用可移动有限长度的窗口进行加权实现的,因此带来了窗函数的选择问题。
  • 原理:窗函数一般具有低通特性,不同的窗函数有不同的带宽和频谱泄漏。
  • 在这里插入图片描述在这里插入图片描述
  • 对比:
名称 主瓣宽度/频谱分辨率 旁瓣宽度/频谱泄漏 优点
汉明窗 大/低频谱分辨率 小/频谱衰减不严重 有低通特性,更好反映短时信号频率特征
矩形窗 小/高频谱分辨率 大/频谱泄漏严重

合成

用频谱参数合成语音信号OverlapAdd2

  • 功能:把频域中一帧帧的频谱幅值参数和相位参数 合成为连续的语音信号
  • 在这里插入图片描述
发布了14 篇原创文章 · 获赞 0 · 访问量 575

猜你喜欢

转载自blog.csdn.net/weixin_44618426/article/details/104387385