点単位の相互情報を利用した鮮明な境界検出 個人理解

点ごとの相互情報を使用した鮮明な境界検出

同じオブジェクト上のピクセルは、異なるオブジェクト上のピクセルよりも全体的な相関が高くなります。
この論文では、gPb-OWT-UCM に基づいて gPb プロセスを改良したエッジ検出方法について説明します。

1.親和性

統計はピクセルに対して実行され、統計の目的は2 種類のピクセル間の類似性です。「親和性」とは、画像内で 2 つのピクセルがどの程度埋め込まれているかを指し、主にオブジェクトの質感に反映されます。

ピクセル A とピクセル B の親和性
P(A,B) をタイプ A ピクセルとタイプ B ピクセルの親和性と呼びます.親和性親和性の関係は、濃度と品質の関係に似ています。「Z」は定数、「w(d)」はガウス関数の分布、dが小さいほどw(d)は大きく、「p(A,B;d)」はAピクセル間の距離d B ピクセルの可能性があります。
論文では、ピクセルの輝度を使用してピクセルを分類することを提案していますが、これが混乱するのですが、2 つのピクセルの色相が異なっていても輝度が同じ場合、それらは同じピクセルとみなされないのでしょうか? 親和性量
P(A,B)を計算した後、さらに親和性を計算しますが、論文では親和性計算式中の ρ を 1.25 としています。P(A) は A の周辺分布です。分数の上部と下部に正則化定数を追加すると、計算がよりスムーズになります。Lab色空間の明るさの範囲は [0,100]、使用するグループ幅は 1.0 であるため、グループの数は 100 となり、コード実装では 100x100 の行列で表される 100x100 のアフィニティ値が得られます。次に、ep カーネル モデルを使用して 2 次元類似性画像をシミュレーションし、論文では、leave-one-out 相互検証法を使用して、ピクセル A の輝度軸とピクセル A の輝度軸の [0,100] をマッピングします。ピクセル B を [0,1] に設定し、モデルの帯域幅は [0.01, 0.1] で制御します。帯域幅は画像ピクセル密度の色の詳細に従って調整する必要があります。もちろん、実装プロセス中に他のより高速なソリューションを使用して、計算プロセスを簡素化し、計算を高速化することもできます。たとえば、他の kde カーネル関数を使用します。この時点で、任意の 2 つのピクセル間の類似性が得られました。
アフィニティ



2D アフィニティ画像

2. エッジ検出

エッジ検出はある程度クラスタリング問題とみなすことができます.スペクトル クラスタリング アルゴリズムはクラスタリング アルゴリズムの 1 つであり、スペクトル グラフ理論に基づいたアルゴリズムです。
親和性マトリックス
グラフ W はスペクトル クラスタリング アルゴリズムの入力として使用され、fi と fj は画像内の 2 つのピクセルであり、exp 関数は類似性値の間隔を拡大するために使用されます。画像に M ピクセルが含まれているとします。この式によれば、サイズ MxM の疎な対称行列が得られます。距離は 5 ピクセルを超え、類似性は 0 になります。この論文では、異なるタイプの特徴は互いに独立している可能性があると述べられており、計算を簡素化するために次の式が言及されています (M は特徴セットのサブセット)。ここでサブセットがどのように取得されるのか理解できません。

簡易計算式
このような親和性行列を取得した後、スペクトル クラスタリング アルゴリズムが使用されます。scipy のスパース モジュールを使用して固有値と固有ベクトルを計算します
ここに画像の説明を挿入します
ここに画像の説明を挿入します
ここで、D 行列は W 行列に基づいて計算された対角行列です。上記の式により、複数の固有値 λ と長さ M の対応する固有ベクトル ν のセットを取得できます。論文では、固有値と固有ベクトルの最初の100グループを選択し、固有値λと固有ベクトルνの各グループに対して、固有ベクトルνを画像とみなし、それに対して8方向のラプラス空間微分フィルタリングを実行します。 . ガウシアンカーネルを使用しても同じことができます。その後、x8 方向に長さ M の 800 個のベクトルのセットを 100 個取得できます。次のように計算します(この式は gPb-OWT-UCM 法から導出されています)。
ここに画像の説明を挿入します

次に、流域指向変換 (OWT) を使用して次の計算を実行します。

おすすめ

転載: blog.csdn.net/qq_40092672/article/details/109309489