「紙の翻訳」GIOU

そして広範なクロスより-GIOU(回帰テストと損失の指標)

注記

  • 「論文の翻訳」のこのシリーズは、個人的な見解を表しています
  • 英語の読解力を向上させるための目的
  • 感謝よりミス、歓迎の読者補正、

1.概要

  ターゲット検出の評価は、最も一般的にクロスとの比を測定するために使用されます。しかし、いくつかの欠点(これは右の最適化目標(多くの場合、バウンディングボックス回帰の距離パラメータを使用して)と最大の間でプレゼンスの費用関数と最適化を参照(テキストが特定した後になります間)このメトリックを最大化があります)理解しています。最適な目標は、自分自身を測定することです。軸対称の場合には、IOUは直接リターンロスとして使用することができます。ただし、投稿したくない場合には、IOUは測定としてではありません。この記事では、私は、IOUのの欠点に対処するために(GIOU)と損失の計算方法による新しいメジャーをご紹介します。最も先進的なネットワークの中にGIOU統合によって(データセットは、最も人気のあるベンチマークPASCAL VOC、COCO、などを使用)、およびGIU IOUは、IOUは一貫GIOU優れた性能を発揮コントラスト。

2.はじめに

  コマ戻しは、最も重要な部分では、2D、3Dコンピュータビジョンの課題の一つです。タスクの前記目標位置、マルチターゲット検出、対象追跡は、非常に正確なセグメント化ブロック回帰インスタンスレベルに依存しています。アプリケーションのパフォーマンスを向上させるために、深いニューラルネットワークを使用して、支配的なアプローチは、より正確な特徴を抽出するために、より良いインフラやより良い戦略を提案することです。しかし、IOUのリターンロス(L1 - LOSS、L2 - LOSS)を置き換えるために使用怠っ、損失指標を改善する、良い方法。

図1

  IOUはまた、多くの場合、2つの任意形状オブジェクトの類似比較として用いられるジャカードインデックスを、知られています。目標符号のIOUの形状特性、寸法の位置は、次いで、標準的な尺度それらの面積を計算します。IOUプロパティにより算出し、スケール不変。このため、良好な特性のために、それは広く、性能評価対象の検出およびセグメンテーションに使用されています。

  しかし、IOUのための良好な相関関係を示さない(\ l_nノルム)\ので(2D、2つのブロックパラメータの3D)損失を最小化し、その値IOUを向上させます。使用LOSSと仮定し、図1(A):例えば\(L_2ノルム\)を各LOSS同じサイズは述べています。同じ議論が他の損失(パネルBおよびC)に拡張することができます。直感的に、良い目標は、必ずしも局所最適IOU局所最適ではありません。そして、IOUのコントラストは、\(L_n-NORM \)は、スケール不変ではありません。この目的のために、そのうちのいくつかは、領域(同じレベル)透視変換を持って、それらが同一の損失を計算していません。また、パラメトリック表現の異なるタイプ間の標準化の可能性の欠如の一部。このような中心点で表されるサイズとして\((X、Y、W、H)\) 複数のパラメータ(回転又は図示の寸法を増加させる)を合わせたように、複雑さが増大します。上記課題を解決するために、いくつかの優れた検出器が提案されているアンカー、コンセプトを最初の仮定を行います。さらに規模を補償する非線形パラメータを定義します。でも、これらのマニュアルの変更で、なしオプティマイザとIOUの違いを作るません。注:これは、評価指標B、AとBの間には均一な(標準化)は、事Aを最小化するために、私たちのトレーニングの表現の意味がありません 例えば、最小二乗法、我々は評価指標を最小化し(平均最小垂直距離線)です。そして、ときに我々は、L1-LOSSを使用して検出をターゲットが、IOUを用いて評価する場合。著者は、2つの一様ではないことがわかった図を示します。アンカーの目標は道の発生を示す表示され、スケールパラメータ(SSD内部のコーデック)はマルチスケール問題を解決するために簡素化することでした

  この記事では、

おすすめ

転載: www.cnblogs.com/wjy-lulu/p/11669556.html