時間領域処理(2)音声信号

短い時間ドメイン処理技法によって、音声信号の相関特性を得ることができます。今日は、どのように音声信号のピッチを抽出する短期自己相関関数を利用することができます。

だから、ピッチそれは何ですか?オープン各声帯と時間のクローズ期間は、基本周波数の逆数と呼ばれるピッチ又はピッチ周期と呼ばれるピッチと呼びます。大部分の関連ピッチと個々の声帯、厚さ、靭性、剛性と発音習慣の長さは、個々の特性を反映しています。また、人物の性別でもピッチは、年齢が高齢男性は、(50Hzの程度)が低い、とすることができ、子どもや若い女性は、(450Hz程度)高いです。ピッチは、主に音声認識及び話者認識、低ビットレート音声符号化、音声分析及び合成に使用され、音声信号の分野において非常に重要な位置を占めています。

短期自己相関関数式:
ここに画像を挿入説明
短期自己相関関数は、特徴の数持っている:
1)、kは0をとる場合、この時の関数の最大値は、信号エネルギーの短時間自己相関関数である(前回の記事を参照) ;
2)元のシグナル配列は周期Tの期間であれば、自己相関関数は、周期Tの周期関数です。この特性を持つ、音声信号はピッチで計算することができます。

栗の場合:

ここに画像を挿入説明
ここに画像を挿入説明
図は、サンプリングレートの長さに基づいて、44100Hz 0.9第2の音声信号のフレーム長は、図1に示すように、一方の赤枠(ボーカルパート)を取って、600のフレームシフトを1200に設定されています。
ここに画像を挿入説明

ボーカル部分の図あるフレーム(A)

ここに画像を挿入説明

フレームの自己相関関数の(B)

チャート(B)から、第1の最大値(0)、K = 236で最大値を除去した後、次に基本周波数に対応したフレームレート:

ここに画像を挿入説明
また、短時間自己相関関数は、また、判定が有声または無声音声等され、終点検出のために使用することができます。さて、今日の内容の話そんなに、次の問題を参照してください!

公開された24元の記事 ウォンの賞賛2 ビュー4138

おすすめ

転載: blog.csdn.net/Leisure_ksj/article/details/104130362