CVPR2020_Improved少数ショットビジュアル分類

記事のリンク:のURL:https://arxiv.org/pdf/1912.03432.pdf

コアの概要

著者らは、視点からの距離を測定する既存の方法FSL創太の利点と欠点について説明し、提案された単純なCNAPSの、方法、特徴抽出部ResNet18 +フィルム層(アダプティブタスク)を使用して、最終的な分類ポイントを、マハラノビス(マハラノビス)距離。キー著者はマハラノビス距離を示し、解決間のクラス内のその優れた点の差に比べて、最も一般的に使用されるユークリッド距離(L2)、マンハッタン距離(L1)と負のドット積(コサイン類似度)等距離メジャーの多くの教訓を保持します。著者はまた、言った:距離測定の選択ではなく、強力な特徴抽出の精度に影響を与える重要な要因FSCを。

要約:

  • 貢献:

    • 分類クラスの共分散距離尺度(すなわち、マハラノビス距離)に基づいて、性能向上CNAPS 6.1%。
    • ショットの非常に小さな数(4)の場合をも構築することができるクラス固有の距離を解決することができる共分散を。
    • 私たちは、新しい「単純CNAPS」アーキテクチャを提案した大幅なパラメータの量を減らし、分類プロセスは、固定パラメータを知ることができない、効果はまだ非常に良いです(3.2%-9.2合計の%)。
  • なぜ仕事:

    • resnet +フィルム適応特徴抽出
    • マハラノビス距離分類(共分散行列を解くことにより、個々の構成要素間の分散が除去され、寸法を排除し、そして追加事前情報配信少ないデータ)。

図1:クラスの共分散測定:特徴点が埋め込まれた画像を表し、各色のクラスが決定境界ジャンクション、代わっクエリー画像の五芒星です。左:L2ベースの標準距離、すなわち、ユークリッド距離、右パネル:マハラノビス距離(距離ベースのメトリッククラス共分散)。比較を容易にするために、我々は、セグメント化された表面リニア婚約描画空間変換を行っています。データセット:機能:アウト・オブ・ドメイン交通標識セット。この目的は、5つのクラス112個の支持サンプル、各クラスクエリインスタンスの合計を含んでいます。私たち(右)境界の決定とより良い整列のサポート埋め込み、およびすべての正しい分類、L2の誤った分類に基づいて分割されている3つのカテゴリがあります。


アルゴリズムセクション

以下は、FSL既存のメソッドを可視化されます。適応戦略は抽出を備えています。縦軸::横軸の分類。

図モデル構造は、図の下に示されています。CNAPSモデルの特徴抽出に基づいて開発されているのと同じ部分、部分構造である(ResNet18 +フィルム層適応である:適応モジュール、機能の各ブロックのための+スケール現在のタスクシフトを行うように適合、トレーニングによって得られた支持組)は、主な違いはないオリジナルCNAPSの分類は、線形判別器学習処理ソフトマックス直接ソルバーから、単純CNAPSは、本明細書マハラノビス距離、を経て得られた最終的な分類結果を使用することですパラメータのみ、共分散行列を計算する必要があり
、すなわち、分類結果のSoftMax =(\(D_M \) センターサポートは、そのクエリ)を埋め込むことを意味埋め込み)。

1.特徴抽出:


resnet18、その後、サポート機能膜層に、各ブロックのうちimagenet事前訓練に作られた機能ブロック\(\ psi_ \ファイ^ I \) 適応パラメータを学習(\(\ gamma_i、\ beta_i )\ 、良いトレーニング\(\ psi_ \ファイ^ I \) 粗いフィーチャi層のためのシフト+スケール処理を行い、機能)が注目と(同様の無関係な特徴領域を無視し、現在のタスクに適応。

2.分類

2.1古いバージョンのCNAPS:

カテゴリーアダプタは、学習の線形分類することによって達成することができます。分類結果= \(のSoftMax(WはF_ \シータ^ \ガンマ(X_I ^ *)+ b)は\)、B、及びWは、クラス分類適応ネットワークである\(\ psi_ \ PHI ^ cは \) が生成されます。

\ [[A、B] = [\ psi_ \ PHI ^ C(\ mu_1)\ psi_ \ PHI ^ C(\ mu_2)、...、\ psi_ \ PHI ^ C(\ mu_k)] ^ T \]

カテゴリkについて、対応する行(第k行目)は、重量クラスである\(\ psi_ \ PHI ^ C (\ mu_k)\) クラス平均\(\ mu_k \) 平均プール)。

2.2シンプルCNAPS

分類確率は(kはk番目のカテゴリを表す)を算出します。

\ [P(Y_I ^ * | F_ \シータ^ \ガンマ(X_I ^ *); S ^ \ガンマ)=ソフトマックス(-d_k(F_ \シータ^ \ガンマ(X_I ^ *); \ mu_k))\]

どこに\(d_k \)であるマハラノビス距離:

\ [D_k(X、Y)= \ FRAC {1} {2}(X - Y)+ T(Q ^ \ Gamma_k)^ { - 1}(X - Y)\]

\(Q ^ \ Gamma_kは\)タスクとクラス固有の共分散行列です。数を設定サポートを考慮すると、空間次元特性のショットよりもはるかに小さくすることができる、共分散行列が正則(可逆保証)を実行します。

\ [^ Q \ Gamma_k = \ lambda_k ^ \ガンマ\ Sigma_k ^ \ガンマ+(1- \ lambda_k ^ \ガンマ)\シグマ^ \ガンマ+ \ベータI \]

前記\(\ Sigma_k ^ \ガンマ\ ) クラス(クラス内のタスク)の共分散行列であり、\(\シグマ^ \ガンマ\)はクラス間(全クラス・イン・タスクである ) の共分散行列(無視カテゴリ情報質問:(\ MU \)\ ??すべての平均プールされたディエンベディングどのように行います)。\(\ Sigma_k ^ \ガンマ\ ) 表現(\(S ^ \ガンマ\):SETをサポートしています):

\ [\ Sigma_k ^ \ガンマ= \ FRAC {1} {S ^ \ガンマ-1}(\和_ {(X_I、Y_I)\ S ^ \ガンマにおける}(F_ \シータ^ \ガンマ(X_I) - \ mu_k )(F_ \シータ^ \ガンマ(X_I) - \ mu_k)^ T)\]

割合は、(\ラムダ\)\次のように定義されます\(\ lambda_ \ガンマ^ K = | S_ \ガンマ^ K | /(| S_ \ガンマ^ K | +1)\)

  • 場合\(| S_の\ガンマ| = 1、Q_ \ガンマ^ K = 0.5 \シグマ^ \ガンマ+ \ベータI \) この時間は、\(Q_ \ガンマ^ K \ ) (正則化パラメータβサイズに依存しますユークリッド距離に近いです)。
  • とき\(| S_ \ガンマ^ K | = 2、\ lambda_ \ガンマ^ K = 2/3、Q_ \ガンマ^ K = 2/3 \ Sigma_k ^ \ガンマ+ 1/3 \シグマ^ \ガンマ+ \ベータ版I \) すなわち\(Q_ \ガンマ^ K \ ) このとき、より大きな全クラス・イン・タスクによるクラス共分散の影響共分散行列(\ \シグマ^ \ガンマ\は ) より少ない影響です。
  • 高いショットの場合には、\(\ lambda_ \ガンマ^ K \)衝撃(クラスレベルの共分散)によって、すなわち完全にクラス内共分散行列、1に近い値。

直感的に理解される:数SHOT大きく、\(\ lambda_ \ガンマ^ K \)より大きい、クラス内共分散タスク\(\ Sigma_k ^ \ガンマ\ ) より正確な推定値、\(Q_ \ガンマ^ K \ )値は次のようになります\(\ Sigma_k ^ \ガンマ\ ) の決定。著者はまた考えられ、\(\ lambda_ \ガンマ^ K \) メソッドのパラメータを学習するように設定され、その結果がこのような直接的な方法が最善設定することを示しています。

SoftMax(マハラノビス距離)の後、多変量ガウス分布に相当します。

\ [P(Y_I ^ * = K | F_ \シータ^ \ガンマ(X_I ^ *)、S ^ \ガンマ)= \ FRAC {\ pi_k \ mathcal {N}(\ mu_k、Q_k ^ \ガンマ)} {\ sum_ {K '} \ pi_ {K'} \ mathcal {N}(\ mu_ {K '}、Q_ {K'} ^ \ガンマ)} \]

ガウス混合係数(\ \ = pi_k。1 / K \)同一の各構成要素の(係数等しい貢献。契約ガウシアンであるアナロジーユークリッド距離、\(\ mu_k \)分散の対象と周辺。1 \(Q_k ^ \ガンマ= 1 \)各カテゴリの分散のために予め設定された単位法線分布は、)同じです。

実験の詳細

データセット:メタデータセット:ILSVRC-2012(ImageNet)、Omnilot、FGVC-航空機、CUB-200から2011(鳥)、記述可能なテクスチャ(DTD)、QuickDrawの、FGVCx菌類(カビ)、VGGフラワー(花)、交通サイン(看板)とMSCOCO。八は、トレーニングの前に、二つの試験(治外法権)の後、最初の8つは行うには、ドメインテストの小さな数を選択しました。

他の距離メトリックと比較する(L1、L2、負のドット積を二乗)

感想

アルゴリズムの構造は、主に理論的な言説では、技術革新は主に、比較的簡単であるマハラノビス距離距離メトリックは、特徴空間に適用される上。著者は、このステップを埋め込む機能が非常に重要であり、あなたはより多くのエンド・ツー・エンドの構造は、そのような注意、それを考慮することができるという特徴の最終的な分類精度抽出個々の無い大きなインパクト「カテゴリインジケータ」上に構築されたと考えていますまた、マルチスケールが行っている考えると、機能のうちブロック上の距離を求めていると言っていなかった他の著者は思い出されることはありませんか?

おすすめ

転載: www.cnblogs.com/zzq-123456/p/12637200.html
おすすめ