2020-2 |音声信号処理
フレーミング
- 理由:臓器の慣性運動により、音声信号は短期間はほぼ変化しない、つまり、音声信号は短時間安定していると見なすことができるため、音声信号をいくつかの短いセグメントに分割して処理、つまりフレーミングを行うことができます。
- 方法:可動有限長ウィンドウで重み付け
- パラメータ:
フレーム長wlen
フレームのincシフト前後のフレームのオーバーラップ長;一般的なフレームシフト/フレーム長=
0〜0.5フレームNframe(データ長-(フレーム長-フレームシフト))/フレームシフト;一般的な1秒あたりのフレーム数33〜100フレーム - 実装:エンフレーム(x、win、inc)
ウィンドウを追加
- 理由:フレーミングは、重み付けに限られた長さの可動ウィンドウを使用して実装されているため、ウィンドウ関数を選択する際に問題が発生します。
- 原則:ウィンドウ関数は一般にローパス特性を持ち、ウィンドウ関数が異なると、帯域幅とスペクトル漏れが異なります。
- コントラスト:
名前 | メインローブ幅/スペクトル分解能 | サイドローブ幅/スペクトル漏れ | アドバンテージ |
---|---|---|---|
ハミングウィンドウ | 大/低スペクトル分解能 | 小/スペクトル減衰は深刻ではありません | 短期信号の周波数特性をよりよく反映するローパス特性を持っています |
長方形の窓 | 小さい/高いスペクトル分解能 | 大きな/深刻なスペクトル漏れ |
合成
音声パラメータをスペクトルパラメータOverlapAdd2で合成
- 機能:周波数ドメインのフレームのスペクトル振幅と位相パラメーターを合成して、連続した音声信号を生成します