SiamFC++: ターゲット推定ガイドラインによる堅牢かつ正確な視覚追跡に向けて(AAAI2020)

著者らは、高性能の汎用オブジェクト トラッカーの一連の設計ガイドラインを提案しています。

  • G1: 追跡ネットワークは 2 つのサブタスクに分解できます。1 つは分類で、もう 1 つは位置の正確な推定です。強力な分類器(分類ブランチ)がないと、トラッカーはターゲットと背景や干渉を区別できず、モデルの識別性が低下し、VOT 評価の R(堅牢性)指数が高くなくなります。索引。正確な状態推定(回帰分岐)がないとトラッカーの精度が低下し、VOT評価指標の性能はA(精度)指標が高くありません。
  • G2: 分類スコアは、オブジェクトの存在の信頼スコアを直接表す必要があります。分類と状態推定に使用される特徴マップは分離する必要があり、分類ブランチで得られた特徴マップを状態推定に直接使用することはできないため、精度がある程度低下します。
  • G3: 追跡方法は、割合/比率分布と同様の事前知識を追加すべきではありません。既存の方法は通常、データ分布の事前知識に依存しており、これはモデルの汎化パフォーマンスに影響を与え、その汎用性に影響を与えます。シャム ネットワークは、モデルの識別性を低下させる、プリセット アンカーではなく元のテンプレート イメージと一致する必要があります。SiamFC++ の A 値は SiamRPN++ よりわずかに低いですが、テストプロセス中に R 値は SiamRPN++ よりも高くなります。著者は、これはアンカーによって引き起こされると考えています。論文の実験部分で、著者は SiamRPN シリーズがこれは、アンカーとイグザンプラの間にいくつかの違いがあることを意味し、その結果、SiamRPN シリーズのロバスト性が低くなります。
  • G4: 分類の信頼度を直接使用して予測ボックスを選択するとパフォーマンスの低下につながるため、分類に依存しない推定品質スコアを使用する必要があります。

主な貢献:

  • 最新のトラッカー向けのオブジェクト状態推定基準の実用的なセットを設計する
  • 設計ガイドラインに従って、シンプルだが強力な SiamFC++ トラッカーが提案されています
  • 5 つの困難なベンチマークで最先端の結果を達成しました。その中で、TrackingNet データセットでは 90FPS を超える速度で 75.4 の AUC スコアを達成しました。

ここに画像の説明を挿入

ネットワーク構造は非常にシンプルで直感的であり、まず、同じ φ (作者のソースコードは AlexNet や GoogleNet などのバックボーン ネットワークを提供します) を特徴抽出に使用し、得られた特徴マップをそれぞれ分類ブランチと回帰ブランチに入力します。 2 つの分岐では、テンプレートの特徴マップと検索特徴マップが相互相関計算を実行します。
応答グラフを取得した後, 関連するヘッド操作を実行します. ここで, 著者は分類スコアと位置回帰スコアをそれぞれ取得するために使用される 2 つのヘッドを提案します. 分類スコアとターゲットの関係のバランスをより良くするために位置に応じて、作成者は品質スコアリングを導入し、品質スコアに分類スコアを乗算して、選択した予測ボックスの最終スコアを取得します。このうち、品質スコアについて、著者は次の 2 つの計算方法を定義しています。

ここに画像の説明を挿入

の:

ここに画像の説明を挿入

s はネットワークの合計ステップ サイズ (論文では s=8)、( x 0 , y 0 ) (x_0, y_0)( ×0y0)( x 1 , y 1 ) (x_1, y_1)( ×1y1)は、グラウンド トゥルースの左上隅と右下隅の座標です。

ここに画像の説明を挿入

その中でもBBさんはBは予測ボックス、B ∗ B^*Bはグラウンドトゥルース境界ボックスです。

推論中、最終的なボックス選択のスコアは、PSS と対応する予測分類スコアを乗算することによって計算されます。このようにして、オブジェクトの中心から遠く離れた境界ボックスの重みが大幅に軽減され、追跡精度が向上します。

SiamFC++ は、SiamFC に基づいて位置回帰と推定品質スコアを追加し、トレーニングにさまざまな損失ジョイントを使用することで、追跡パフォーマンスを大幅に向上させます。

おすすめ

転載: blog.csdn.net/weixin_48158964/article/details/131502045