CRLBP: テクスチャ分類用の堅牢なローカルバイナリパターンを完成

CRLBP: テクスチャ分類のための完全な堅牢なローカル バイナリ パターンの
ためのテクスチャ分類のための完全な堅牢なローカル バイナリ パターン
元のアドレス: https://www.sciencedirect.com/science/article/pii/S0925231212008545?via%3Dihub

まとめ

オリジナルのローカル バイナリ パターン (LBP) 記述子には 2 つの明らかな欠点があります。1 つはノイズに敏感であり、場合によっては同じバイナリ コードで異なる構造パターンを記述する傾向があり、その識別性が必然的に低下します。これら 2 つの欠点を克服するために、この論文では、完全にロバストなローカル バイナリ パターン (CRLBP) と呼ばれるロバストな LBP フレームワークを提案します。このフレームワークでは、各中心ピクセルの値が、平均ローカル グレー レベルで置き換えられた 3*3 ローカル エリアになります。中央グレー値と比較して、平均局所グレー レベルはノイズや照明の変化に対してより堅牢です。CRLBP の堅牢性と安定性を向上させるために、加重ローカル グレースケール (WLG) が導入され、従来の中央ピクセル グレースケール値が置き換えられます。4 つの代表的なテクスチャ データベースに関する実験結果は、提案された方法がノイズに強く、高い分類精度を達成することを示しています。

関連作業

ローカル 3 値パターン (LTP)

中心ピクセルのグレー値がしきい値として直接使用されるため、LBP は、特に均一に近い画像領域ではノイズに非常に敏感です。
ここに画像の説明を挿入
ここに画像の説明を挿入
この欠点に対処するために、Tan と Triggs は元の LBP を 3 値 LTP に拡張しました。LTP 記述子の構造は次の式で説明できます。
ここに画像の説明を挿入
ここで、gc は中心ピクセルのグレー値を表し、gp (p=0,...,P-1) は円上の隣接するピクセルのグレー値を表します。半径 R、P は隣接するピクセルの総数、t はユーザー指定のしきい値です。図 3 に示すように、しきい値 t を使用することで、従来の 2 値 (0, 1) LBP コードが 3 値 (-1, 0, 1) の 3 値コードに拡張されます。次に、上部と下部のパターンが別々にエンコードされます。LTP コードはノイズに対してより堅牢ですが、しきい値 t はユーザーによって指定されるため、モノトーン グレースケール変換に対して厳密に不変ではなくなります。

ここに画像の説明を挿入

完全なLBP (CLBP)

LBP のもう 1 つの欠点は、多くの異なる構造スキームが同じ LBP コードを持つ可能性があることです。図 4 に示すように、パターン (a) と (b) は同じ LBP コードを持ちますが、類似した局所構造を持っているとは言い難いです。
ここに画像の説明を挿入
局所構造の識別能力を高めるために、Guo らは CLBP 法を提案しました。CLBP では、画像の局所的な差分が 2 つの相補的な成分、符号 (sp) と大きさ (mp) に分解されます。
ここに画像の説明を挿入
ここで、gp、gc、および s(x) は式 (1) に示すように定義されます。CLBP_Sign (CLBP_S) および CLBP_Magnitude (CLBP_M) という名前の 2 つの演算子がこれをエンコードするために提案されています。ここで、CLBP_S は従来の LBP に相当し、CLBP_M は大きさの局所的な分散を測定します。CLBP_Mは次のように定義できる。
ここに画像の説明を挿入
このうち、閾値cIは画像全体の平均階調として設定される。3 つの演算子 CLBP_S、CLBP_M、CLBP_C (CLBP_S/M/C と表記) を組み合わせることで、難読化モードの区別が大幅に向上します。

完全な堅牢なローカル バイナリ パターン (CRLBP)

前述の問題に対処するために、このセクションでは、著者らは、LTP と CLBP の利点を継承しつつ、それらの欠点を克服する堅牢な LBP フレームワークを提案します。

堅牢なローカル バイナリ パターン (RLBP)

ノイズの影響を受けず、単調グレースケール変換に対して不変であるしきい値を見つけるために、平均ローカル グレースケール (ALG) を次のように定義します。 ここで、 g は中心
ここに画像の説明を挿入
ピクセルのグレースケール値を示し、gi (i=1,..., 8) 隣接するピクセルのグレー値。ALG はローカル テクスチャの平均グレー レベルを表します。これは、中心ピクセルのグレー値よりもノイズに対して大幅に堅牢です。次に、グレー値の代わりに ALG をしきい値として使用し、ロバスト ローカル バイナリ パターン (RLBP) と呼ばれる LBP プロセスを採用します。したがって、RLBP は次のように定義できます。
ここに画像の説明を挿入
ここで、gc は中心ピクセルのグレー値を表し、gp (p=0,...,P-1) は半径 R の円上の隣接するピクセルのグレー値を表し、Pは隣接ピクセルの総数、gci (i=1,...,8) は gc の隣接ピクセルのグレー値を表します。RLBP はピクセルの平均ローカル グレー レベルをしきい値として使用するため、ノイズの影響を受けにくいことは明らかです。さらに、各隣接ピクセルの近傍も考慮されるため、同じ LBP コードを持つ 2 つの異なるパターンが異なる RLBP コードを持つ可能性があります。したがって、RLBP は、元の LBP の上記 2 つの欠点を克服できます。
ALG は、個々のピクセルの特定の値を無視します。ただし、場合によっては、中心ピクセルに関する特定の情報が必要になることがあります。アンチノイズと個々のピクセルの情報のバランスを取るために、加重ローカル グレースケール (WLG) を次のように定義します。ここで、
ここに画像の説明を挿入
g と gi は式 (5) に示すように定義され、α はユーザーが設定するパラメーターです。 。α が 1 に設定されている場合、WLG は通常の ALG と同等であることに注意してください。ここで、RLBP は次のように計算できます。
ここに画像の説明を挿入
式中、gp、gc、gciの定義は式(6)に示されており、αはWLGのパラメータである。この論文では、最適なパラメータ α を選択するために、大規模なテクスチャ データベースに対して一連の実験を実施します。CUReT データベース内の画像は、大幅な照明変化、視点変更、スケール変換のもとでキャプチャされます。したがって、実験セットアップは CUReT データベースとノイズの多い CUReT データベース (SNR=5) で実行されます。これについてはセクション 4.3 で後述します。CUReT データベースとノイズのある CUReT データベースのさまざまなパラメータ α の応答関数を図 6 に示します。図 6(a) に示すように、通常のデータベースでは、α を 8、9、10 に設定すると、RLBP のパフォーマンスが向上します。図 6(b) は、α が 1 に設定されている場合、RLBP がノイズ対策で最高のパフォーマンスを発揮し、α が 8 より大きく設定されている場合、RLBP がノイズに対してより敏感になることを示しています。したがって、我々の方法では、実験結果に従ってαを1または8に設定します。言い換えれば、RLBP (α = 1) は RLBP (α = 8) よりもノイズの影響を受けにくいですが、RLBP (α = 8) はローカル近傍セットとグレースケールを同時に抽出するため、複雑な照明や視点の変更の下ではより安定しています。単一ピクセルの情報。
ここに画像の説明を挿入
図 6: さまざまな α 値 (0 ~ 20) に対するテクスチャ分類率。(a) R = 1、P = 8、および 46 のトレーニング サンプルを使用した CUReT データベースの分類率、および (b) R = 1、P = 8、SNR = 5 および 46 のトレーニング サンプルを使用したノイズのある CUReT データベースの分類率。

完全な堅牢なローカル バイナリ パターン (CRLBP)

LBP のカオス パターンを区別するために、RLBP は CLBP の効果的なフレームワークを継承しています。大きさ(大きさ) mp は通常次のように定義されます。
ここに画像の説明を挿入
ここで、gp、gc、gci は式 (6) のように定義され、gpi (i=1,...,8) は隣接するピクセルの階調値を表します。 gp、αはWLGパラメータです。RLBP_magnitude (RLBP_M) は、WLG の局所分散を測定します。したがって、RLBP_M を次のように定義します。
ここに画像の説明を挿入
ここで、閾値 c は画像全体の平均値 mp として設定されます。画像の中心階調を表す中心ピクセルも識別情報を持っています。したがって、次のように局所中心情報を抽出するための RLBP-Center (RLBP_C) という名前の演算子も定義します。
ここに画像の説明を挿入
ここで、しきい値 cI は画像全体の平均局所グレー レベルに設定されます。CLBP で説明されているように、同じ方法を使用して 3 つの演算子 RLBP、RLBP_M、および RLBP_C を組み合わせます (CRLBP と表示されます)。

非類似性の尺度 非類似性の尺度

2 つのヒストグラム間の差異を区別するために、いくつかの尺度が提案されています。このペーパーでは、X2 統計を利用してこの問題に対処します。H={hi} と K={ki} (i=1, 2...B) が 2 つのヒストグラムを表す場合、X2 統計は次のように計算できます。 この論文では、すべての手法が分類に最近傍分類器を使用することを前提としています
ここに画像の説明を挿入
。 。

おすすめ

転載: blog.csdn.net/weixin_45184581/article/details/124965257