ターゲット検出アンカーベースとアンカー無料
1.アンカーフリーのアンカーベースの違いや
ディープ学習目標検出は、通常はペアで分類と回帰問題の候補領域の一部をモデル化しています。二段検出器は、候補領域がRPN提案が生成されるが、RPN自体は依然としてアンカー分類および回帰のスライディングウィンドウの実施形態で生成され、単一ステージ検出器において、候補領域は、スライディングウィンドウの実施形態のアンカーによって生成されます。
アンカーのない検出問題は、別の手段によって解決されます。また、物体の中心を決定するために、二つのサブ問題、すなわちに分割四予測フレーム。オブジェクトの中心が、クラス予測にターゲットの予測中心予測され、またソフトのcenternessスコアを予測することができます。4つの境界を予測するために、それはより一貫して、グランドトゥルースに四方からの画素フレームを予測しているが、後退の範囲を制限するために、いくつかのトリックを使用します。
2.アンカー自由誘導クラスアルゴリズム
A.の多点関節式に基づいて鍵方式
a.CornerNet / CornerNet-LITE:左上隅+右下隅
b.ExtremeNet:アップし、約ダウン4極値ポイント+中心点
c.CenterNet:オブジェクト検出のためのキーポイント三つ子:左上+右下+中心点
d.RepPoints: 。暴行適応学習サンプルに9
e.FoveaBox:中心点+左隅+右下隅
f.PLN:4隅の点+中心点
単一の中心点に基づいB.予測方法
a.CenterNet:ポイントなどのオブジェクト:中心点+幅+高さ
b.CSP:中心点+高さ(高さ計算幅に基づいて予め設定された固定ターゲットのアスペクト比)
c.FCOS:中心点フレームの+ から2
3.なぜ缶アンカーフリーカムバック
アンカーのないアプローチは、精度のアンカーベースの方法を一致させることができ、私は第二焦点損失を帰せ、最大の成果は、FPNに帰するべきだと思います。(ハートOS:高RetinaNetレース)。各位置の場合にのみボックスを予測する、十分に補償再生スケールのFPN構造は、FocalLossは中央領域を予測するための大きな助けとなります。もちろん、転送作業の方法はとても簡単でやることではない、私は詳細の一部は、このようなオーバーラップ領域を扱うようにかなりの影響力を持っているだろうと信じて、リターンの範囲の制限は、どのように異なるFPNレベルに割り当てる対象となり、ヘッド共有パラメータなどか。
4.アンカーのない和単一のアンカー
同等であってもよい正方形アンカーの形態で上述した各アンカーフリー位置は、FCNは、特徴マップの各位置のための(位置及びカテゴリを含む)フレーム構造予測を使用することです。しかし、アンカーのない、まだ理にかなって、我々はアンカー-前にフリー呼び出すことができます。加えて、両方の正式な等価が、実際の操作は依然として差です。アンカーベースの方法で、各位置は、可能性があるが
唯一のアンカーが、予測はアンカーを一致させるために、オブジェクトに基づいており、アンカーのない方法は、通常はこのマッチング点に基づいています。
3.アンカーのない制限の
上記のいくつかの方法の精度はRetinaNetに匹敵することができるが、そこには明らかな利点は、(そこスピードある)ではない、さらに二段カスケード方法遠い差からけれども。アンカーベース、インスタンスレベル特徴表現として単一の位相検出器は、2つの位相検出器として良好としないで、上記ヘッド内のパターンは比較的少ないであろう。道Tucaoすることで、より良い程度に見える成果を達成するために、紙の数が少ない上に、実験的にまたは公正な比較がない詳細の一部を非表示にします。
前記物体検出アルゴリズムは、一般的に分割されているアンカーベース、アンカーフリーは、二つの収束、差分を抽出アンカーブロックを用いない候補オブジェクトが存在しないことです。
A.アンカーベースのアルゴリズムが代わっfasterRCNN、SSD、YoloV2 / V3等に基づいています。
fasterRCNN-を提供スケールの三種類アスペクト三種類の割合の合計9つのアンカー抽出候補ブロックを
B.アンカーのないアルゴリズムが代わっ基づいているCornerNet、ExtremeNet、CenterNet、FCOSのような。
CornerNet-ダイレクト予測は、確率は、左上の各点は、左上右下の角エキスを組み合わせることで、目標ボックスの右上隅を下げるということです
C.融合アンカーベースおよび方法のアンカーフリーブランチ:FSAF、SFace、GA-RPNのように。
FSAF-両方先験的セットアンカーベースの支店がある異常強化アンカーのない枝検出能力の目標比率は、
(とも呼ばれる7アンカーアンカーボックス)トレーニングの前で、使用してトレーニングセット矩形枠のセットのうちのようにk-meansクラスタリングの方法と目標長さと主に幅寸法の集合を表します。これらの場合に特徴的図が生成推論摺動アンカー抽出n番目の候補矩形さらに分類および回帰を行う(詳細な説明提示を参照アンカー考えfasterRCNN記事を)。すなわち、従来の目標検出アルゴリズム、画像ピラミッドを使用することである* M nはスライディングウィンドウです。図従来の方法であって、一般的にウィンドウサイズを摺動固定のみ異なるスケールと同様の図アルゴリズムは、固定されている、請求fasterRCNN アンカーマルチスケール。
物体検出の枠組みの三つの典型的なフローチャート
8.ヨロアルゴリズム3つのバージョンの合計は、YoloV1のようにカウントすることができるアンカーフリータイプ; YoloV2が導入されたアンカー、YoloV3も使用アンカー。