[特徴抽出] matlabフォルマント推定に基づく[Matlabソースコード550期間を含む]

1.はじめに

フォルマントとは、エネルギーが比較的音のスペクトルに集中している領域を指します。フォルマントは、音質の決定要因であるだけでなく、サウンドトラック(共振空洞)の物理的特性も反映します。

母音と子音の音のスペクトルの包絡線上のピーク位置。フォルマントの本来の意味は、音響空洞の共振周波数を指します。母音と子音の生成では、音源のスペクトルは音響空洞によって変調されます。元の倍音の振幅は、周波数の増加に伴って減少しなくなりますが、一部は強まり、一部は弱まり、浮き沈みのある新しいパッケージを形成します。周波数曲線のピークの値は、音響空洞の共振周波数と一致しています。母音に関する限り、最初の3つのフォルマントには音色の定性的な規制があります。最初の2つのフォルマントは舌の高さに特に敏感であり、音響母音マップはこれら2つのフォルマントの周波数値に基づいて描画されます。 。of。フォルマントの3次元超音波検査は、エネルギーが集中した水平バーとして表示されます。

フォルマントは声道の共鳴特性を反映した重要な特徴であり、発音情報の最も直接的な情報源であり、人々は音声認識でフォルマント情報を使用します。そのため、フォルマントは音声信号処理において非常に重要な特性パラメータであり、音声認識の主な特性や音声符号化伝送の基本情報として広く利用されています。フォルマント情報は周波数エンベロープに含まれているため、フォルマントパラメータを抽出するための鍵は、自然な音声スペクトルエンベロープを推定することです。一般に、スペクトルエンベロープの最大値はフォルマントです。

フォルマント生成の原理とその音質への発現

フォルマントの分布位置は、音を出す媒体の共鳴物理構造(共鳴物理構造)に基づいています。

人間の声であろうと楽器であろうと、その音の特徴は、人間の声帯や楽器の振動する葦などの音響システムと、共鳴システムの2つの要素に由来します。楽器の共鳴システムが異なると、特定の周波数領域の部分音の振幅が目立つようになります。このように、これらの領域は、この楽器に固有の共鳴ピークを生成します。これらの共鳴ピークは、楽器のサイズと形状に密接に関連しています。レゾナンスボディ。楽器の構造は安定しているため、基本周波数に関係なく、楽器が発するすべての音は同じ共鳴ピークを示しますが、その重要性は強いか弱いかです。これは、多くの楽器で、同じ楽器によって生成された異なる音が同じ音質である理由を説明するのに役立ちます。

音声音響学では、人間の声には、鼻孔、咽頭腔、口腔のサイズなど、独自の生理機能の影響を受ける独自のフォルマント領域もあります。これらの共鳴空間の形や大きさの変化(喉や口の形の変化など)を利用することで、音のフォルマントを変えることができます。異なる人間の声と母音を区別できる理由は、主にそれらのフォルマント分布の位置に基づいています。

1フォルマントとフォルマントの役割
  について前に話したように、声道の周期的なパルス励起信号が声道を通過すると、声道に共鳴が生じます(このプロセスは声道モデルと呼ばれます)。音声生成モデルでは)、結果として一連の共振周波数が発生します。この一連の共振周波数はフォルマント(周波数)と呼ばれます。一般に、音声スペクトルエンベロープのいくつかの最大値はフォルマント周波数であると考えられています。フォルマントの周波数と帯域幅を正確に検出することは、さまざまな決勝戦を区別し、音声セマンティクスの認識を向上させるのに役立ちます。

2共鳴ピークの推定の難しさ
(1)誤った共鳴ピークの存在。
(2)隣接するフォルマント周波数が比較的近い場合を区別するのが難しい。
(3)高音の音声抽出するのが難しい
要するに、ピッチ周期推定と同様に、現在、完全に正確な推定方法はありません。

3フォルマント推定前処理
(1)プリエンファシス。目的は、唇の放射の影響を取り除き、声道反応の分析を容易にすることです。
(2)エンドポイント検出。目的はピッチ周期推定と同じであり、サイレントセグメントの音声を分析する必要はありません。

4共鳴ピーク推定法
(1)ケプストラム法。
  音声のケプストラム処理では、励起信号を声道応答から分離し、励起信号を削除してから、フーリエ変換を実行して声道応答のエンベロープを取得し、エンベロープの最大値を見つけることができます。これは対応するフォーマントです。周波数。
(2)LPC法で
  は、線形予測により予測係数のセットを取得できます。この係数のセットと全極チャネル応答モデルに従って、FFT変換を実行してチャネル伝達関数のパワースペクトルを取得し、次に、対応する最大値を計算すると、対応するフォルマント周波数を取得できます。
(3)HHT
  法は詳細に調べられておらず、具体的な手順はまだわかっていません。これは主に経験的モード分解(EMD)とヒルベルトによるものです。変換して、信号の振幅、周波数、位相を見つけます。

第二に、ソースコード

%实倒谱法共振峰估计
clear all; clc; close all;

waveFile='C4_3_y.wav';               % 设置文件名
[x, fs, nbits]=wavread(waveFile);                 % 读入一帧数据
u=filter([1 -.99],1,x);                                   % 预加重
wlen=length(u);                                          % 帧长
cepstL=6;                                                   % 倒频率上窗函数的宽度
wlen2=wlen/2;               
freq=(0:wlen2-1)*fs/wlen;                          % 计算频域的频率刻度
u2=u.*hamming(wlen);		                      % 信号加窗函数
U=fft(u2);                                                 % 按式(4-26)计算
U_abs=log(abs(U(1:wlen2)));                     % 按式(4-27)计算
 [Val,Loc,spect]=Formant_Cepst(u2,cepstL);       % 计算出共振峰频率
FRMNT=freq(Loc);                                 % 计算出共振峰频率
subplot(211)
plot(freq,U_abs,'k'); 
xlabel('频率/Hz'); ylabel('幅值/dB');
title('(a)信号对数谱X\_i(k)')
axis([0 4000 -6 2]); grid;
subplot(212)
plot(freq,spect,'k','linewidth',2); 
%LPC内插法的共振峰估计
clear all; clc; close all;

fle='C4_3_y.wav';                            % 指定文件名
[x,fs]=wavread(fle);                        % 读入一帧语音信号 
u=filter([1 -.99],1,x);                     % 预加重
wlen=length(u);                             % 帧长
p=12;                                       % LPC阶数
freq=(0:256)*fs/512;                        % 频率刻度

[F,Bw,pp,U]=Formant_Interpolation(u,p,fs);          %LPC内插法求共振峰
plot(freq,U,'k');
title('声道传递函数功率谱曲线');
xlabel('频率/Hz'); ylabel('幅值');
ll=length(F);                             % 共振峰个数
for k=1 : ll
    line([F(k) F(k)],[0 pp(k)],'color','k','linestyle','-.');    
end
% LPC求根法的共振峰估计
 clc; close all;

fle='C4_3_y.wav';                            % 指定文件名
[xx,fs]=audioread(fle);                       % 读入一帧语音信号

u=filter([1 -.99],1,xx);                    % 预加重
wlen=length(u);                             % 帧长
p=12;                                       % LPC阶数
n_frmnt=4;                                  % 取四个共振峰
freq=(0:256)*fs/512;                        % 频率刻度
df=fs/512;                                  % 频率分辨率

[F,Bw,U]=Formant_Root(u,p,fs,n_frmnt);
plot(freq,U,'k');
title('声道传递函数功率谱曲线');
xlabel('频率/Hz'); ylabel('幅值/dB');
p1=length(F);                              % 在共振峰处画线
m=floor(F/df);
pp=U(m);                                    %共振峰幅度
for k=1 : p1
    line([F(k) F(k)],[-5 pp(k)],'color','k','linestyle','-.');
end


3、実行中の結果

ここに画像の説明を挿入します
ここに画像の説明を挿入します
ここに画像の説明を挿入します

四、備考

完全なコードまたは書き込み追加QQ1564658423過去のレビュー
>>>>>>
[機能の抽出] matlabウェーブレット変換に基づくオーディオ透かしの埋め込みと抽出[Matlabソースコード053を含む]
[音声処理] matlabGUIに基づく音声信号処理[Matlabを含むソースコードの問題290]
[音声取得] matlabGUI音声信号収集に基づく[Matlabソースコード291を含む]
[音声変調] matlabGUI音声振幅変調に基づく[Matlabソースコード292を含む]
[音声合成] matlabGUI音声に基づく合成[Matlabソースコードの問題293を含む]
[音声暗号化] matlabGUI音声信号の暗号化と復号化に基づく[Matlabソースコード295を含む]
[音声拡張] Matlabウェーブレット変換ベースの音声拡張[Matlabソースコード296]
[音声認識] matlabGUI音声ベース周波数認識に基づく[Matlabソースコード294を含む]
[音声拡張] Matlab GUIWienerフィルタリングベースの音声拡張[Matlabソースコード298を含む]
[音声処理] matlabGUI音声信号処理に基づく[Matlabソースコード299を含む]
[信号処理] Matlab音声信号スペクトルアナライザーに基づく[Matlabソースコード325を含む]
[変調信号] matlabGUIに基づくデジタル変調信号シミュレーション[Matlabソースコード336を含む]
[感情認識] matlabBPニューラルに基づく音声感情認識ネットワーク[Matlabソースコード349の​​問題を含む]
[音声ステガノグラフィー] Matlabウェーブレット変換に基づく定量化されたオーディオデジタルウォーターマーキング[Matlabソースコードの問題351を含む]
[特徴抽出] matlabオーディオ透かしの埋め込みと抽出に基づく[Matlabソースコード350期間を含む]
[音声ノイズ除去] matlabローパスと適応フィルターノイズ除去に基づく[Matlabソースコード352期間を含む]
[感情認識] matlabGUI音声に基づく感情分類認識[Matlabソースコード354期間を含む]
[基本処理] Matlabベースの音声信号前処理[Matlabソースコード364期間を含む]
[音声認識] Matlabフーリエ変換0-9デジタル音声認識[Matlabソースコード384期間を含む]
[音声認識] 0-9 matlab GUIDTWに基づくデジタル音声認識[Matlabソースコード385を含む]
[音声再生] Matlab GUIMP3設計[Matlabソースコード425を含む]
[音声処理]人間の耳のマスキング効果に基づく音声強調アルゴリズムノイズ比の計算[Matlabソースコード428を含む]
[音声ノイズ除去] matlabスペクトル減算ノイズ除去に基づく[Matlabソースコード429を含む]
[音声認識] matlabの運動量項目に基づくBPニューラルネットワーク音声認識[Matlabソースコード430を含む]
[音声ステガノグラフィ] matlabLSB音声隠蔽に基づく[Matlabソースコード431を含む]
[音声認識] matlabの男性と女性の音声認識に基づく[Matlabソースコード452を含む]
[音声処理] matlab音声ノイズの追加とノイズリダクション処理に基づく[MatlabソースコードIssue473を含む]
[音声ノイズ除去] matlab最小二乗(LMS)適応フィルターに基づく[ Matlabソースコード481を含む]
[音声強調] matlabスペクトル減算、最小平均二乗、およびWienerフィルター音声強調に基づく[Matlabを含むソースコード482期間】
[通信] matlab GUIデジタル周波数帯域(ASK、PSK、QAM)変調シミュレーションに
基づく[ Matlabソースコード483を含む] [信号処理] matlabECG信号処理に基づく[Matlabソースコード484を含む]
[音声ブロードキャスト] matlabに基づく音声ブロードキャスト[Matlabソースコード507を含む]
[信号処理] EEG信号特徴抽出に基づくMatlabウェーブレット変換[Matlabソースコード511を含む]
[音声処理] matlab GUIデュアルトーンマルチ周波数(DTMF)信号検出に基づく[Matlabを含むソースコード512】
【音声ステガノグラフィ】音声信号のデジタル透かしを実現するmatlabLSBに基づく【Matlabソースコード513を含む】
【音声強調】matlab整合フィルターに基づく音声認識【Matlabソースコード514を含む】
【音声処理】ベースmatlabGUI音声周波数ドメインスペクトログラム分析[Matlabソースコード527を含む]
[音声ノイズ除去] matlab LMSに基づく、RLSアルゴリズム音声ノイズ除去[Matlabソースコード528を含む]
[音声ノイズ除去] matlabLMSスペクトル減算音声ノイズ除去[Matlabを含むソースコードの問題529]
[音声ノイズ除去] matlabソフトしきい値、ハードしきい値、妥協しきい値に基づく音声ノイズ除去[Matlabソースコード530を含む]
[音声認識] matlab特定の人の音声認識識別に基づく[Matlabソースコード534を含む]
[音声[ノイズ除去] matlabウェーブレットソフトしきい値音声ノイズリダクションに
基づく[ Matlabソースコード531を含む] [音声ノイズ除去] matlabウェーブレットハードしきい値音声ノイズリダクションに基づく[ Matlabソースコード532を含む]
[音声認識] matlabMFCCおよびSVM固有のヒューマンに基づく性別認識[Matlabソースコード533を含む]
[音声認識] MFCCに基づくGMM音声認識[Matlabソースコード535期間を含む]
[音声認識] matlabVQに基づく特定の人の孤立した単語音声認識[Matlabソースコード536期間を含む]
[音声認識] matlabGUI音声印刷認識に基づく[Matlabを含む]ソースコードの問題537]
[取得と読み取り] matlabの音声収集と読み取りに基づく[Matlabのソースコード538を含む]
[音声の編集] matlabの音声編集に基づく[Matlabのソースコード539を含む]
[音声モデル]に基づくmatlab音声信号数学モデル[Matlabソースコード540を含む]
[音声の健全性] matlabの音声強度と音量に基づく[Matlabソースコード541を含む]
[感情認識] matlabKに基づく最近傍分類アルゴリズム音声感情認識[Matlabソースコードを含む542]
[Emotion Recognition] matlab Support Vector Machine(SVM)に基づく音声感情認識[Matlabソースコード543を含む]
[Emotion認識]ニューラルネットワークベースの音声感情認識[Matlabソースコード544を含む]
[音源定位]音源matlabの異なる空間スペクトル推定に基づくローカリゼーションアルゴリズムの比較[Matlabソースコード545を含む]
[音源のローカリゼーション]異なる信号対ノイズ比で信号を受信するmatlabマイクに基づく[Matlabソースコード546を含む]
[音源のローカリゼーション]ルームインパルスmatlabシングル音源とデュアルマイクに基づく応答[Matlabソースコード547を含む]
[音源定位] Matlab一般化相互相関音源位置[Matlabソースコード548を含む]
[音源定位] Matlabアレイマニホールドマトリックスベースの信号表示[Matlabソースコード549が含まれています]

おすすめ

転載: blog.csdn.net/TIQCmatlab/article/details/114972064