【论文笔记】RefineDet:オブジェクト検出のためのシングルショット洗練ニューラルネットワーク

ペーパー概要

 

 

論文住所:https://arxiv.org/abs/1711.06897

コード住所:https://github.com/sfzhang15/RefineDet

 まとめと個人的な見解

       シングルショットに基づいて、本論文では、ARMおよびODMで構成ニューラルネットワーク検出器を、洗練しました。アンカーの位置およびその後の初期化のために概ね良好リターンの大きさを調整しながら、分類器の探索空間を減少させるために、負のアンカーをフィルタリングするためのアームと、入力としてARMリファインアンカーから得られた先行ODMマルチクラスマルチラベル応答を予測しながら、正確な目標位置とサイズを返します。最後のトレーニングにエンドのマルチタスク損失を使用して、ネットワーク全体。PASCAL VOCでRefineDet 2007、PASCAL VOC 2012 MS COCOデータセットとしながら効率的に最適な検出精度を達成しました。計画は、こうした歩行者、自動車や顔などの他の具体的な目標を検出するためにRefineDetを使用した後の注意メカニズムの導入は、より良い結果を得るためにしています。

       全体構造の観察によって、および同様の構造RefineDet FPN本明細書に記載、FPN、FPNサブネットが機能分類および回帰図ボトム上部方向に入らないことが主な違いと、このようにRefineDet加えて、アンカーは、FPN TCBモジュールの使用は、統合プロセスはいくつかの違いが備わっています洗練されてしまいました。 

貢献

1、ARM及びODMを用いて一段階提案物体検出フレームと

2、ARM TCBのデザインの特徴は、タスクに挑戦予測正確な目標の位置、大きさ、カテゴリラベルを解決するためにODMに転送されます。

3、PASCAL VOC2007、PASCAL VOC2012 MS COCOデータセットし、取得した最適性能RefineDet。 

問題は、解決すべき

問題:達成するための優れた二段精密アプローチ維持一段階の効率に比べ方法

分析

検出精度の一段法が主な理由である二段法、より一般的に低いカテゴリ不均衡

最近のようなこの問題を解決するための方法は:香港らは、ターゲットコンボリューション特性に探索空間を減らすために先験的一定の制限を使用し、林らは、クロスエントロピー基準を再定義しますうまく困難な例を、より注意喪失を訓練し、削減します右のサンプル重量の分類;張ら最大アウトラベルデザインメカニズム偽陽性試料によって引き起こされる不均衡を削減します。

この記事ビューは、一段階法と比較して二段階法は三つの主要な利点を有することです。

  • 不均衡問題カテゴリを解決するためのヒューリスティックと二段サンプリング構造を使用して
  • 二段階のカスケード目標ボックスの回帰パラメータ
  • 二段対象の特性を使用して

フレームワークとの主な方法

1、主なアーキテクチャ:

 

ネットワーク全体が粗いと前景背景スコアを通して濾過負アンカーアームの一部が精製アンカーを取得する相対位置とアンカー回帰損失の大きさを調整する前記2つの主要な構成要素、ARM及びODMを有しています。ODMは、入力としてアンカー正確な分類と回帰操作を洗練されます。ARM TCBへの送信を特徴とODMにしています。

2、TCB(転送接続ブロック)

 

主融合、HIGH_LEVELの使用は、要素ごとの和法を用いて、現在の層の同じ寸法を得るdeconvが特徴付け前記現在階層に上位層に、その結果は、以下、畳み込み層(に入力される。このコンボリューション活性層は、検出された特性のために解決することを保証することです?)。 

図3に示すように、二段階カスケード回帰

  回帰は、一段法のステップは、現在の異なるスケールの異なる層に基づく特徴の目標位置と大きさを予測するために、すなわち、使用され、そしてこのように特にシナリオ小さなターゲット検出が不正確で挑戦されます初期化するために、より良いODMのに戻るためにARMが調整中のアンカーの第1の位置とサイズ:本論文では、2段階のカスケード返品ポリシー。

       各機能は、原稿4のオフセットと前景のクラスを表すために2つのアンカー信頼確率スコアに対する各機能のNボックス図アンカーセル、セルの予測洗練図アンカで定義されています。洗練されたアンカーを取得した後、分類し、正確な位置にその着信ODM図応答特性に対応します。 

4、損失関数 

  添字iはアンカーを表し、Pは、I及びX iが i番目のアンカーの座標を確率及びターゲットアンカーARM精製され、CれるIおよびTはiが予測ODMカテゴリと対応する座標です。L 私は *グランドトゥルースカテゴリで、G I *は、位置とサイズです。N ARMおよびN ODMはアンカーARMおよびODM CKSの数です。L Bは、クロスエントロピー損失やログ損失であり、Lはmはソフトマックス損失です。N場合ARMまたはN ODMは 0であり、対応するエントリはゼロです。

5、実験

PASCAL VOC 2007 PASCAL VOC 2012 MS COCOデータセット内の他の方法と比較して(1)RefineDet。

 

結果はRefineDetを超え、最適な性能の表列挙方法で示されています。

(2)アブレーション:テキストに記載さ三つの方法が負のアンカーフィルタリング、ロール二段カスケード回帰、転送接続ブロック比較です。

 

リフレクションとインスピレーション

全体として、この論文の主革新は、第一オリジナルアンカーの操作を改良することができる拡散段階に二段階カスケード回帰法を用います。全体的な構造は、FPNと非常によく似ています。

 

 

おすすめ

転載: www.cnblogs.com/fanzhongjie/p/11861032.html