ターゲット検出:高速R-CNNの原則

高速R-CNN論文住所:   https://arxiv.org/pdf/1504.08083.pdf

1つの概要:

全体、同時に選択検索と分類および回帰訓練プロセスのステップを加速するR-CNNの速い利点は、著者がR-CNNに比べて改善のためのモデル:.高速R-CNNを提案し、考慮R-CNNが非常に遅いです加速しました。 

R-CNNの修飾部分の速いR-CNN:

  • R-CNN三つのモジュール(CNN、SVM回帰)が大幅に計算及び加速の量を減少させる、集積します
  • 選択的検索を行って、特徴マップ上の選択検索インターセプト候補領域の使用を、元の画像が、CNNを通じて初めてを抽出し、リターンを分類しません
  • 異なるスケール画像との互換性のために、著者らは、特徴ベクトルの次元の固定プールにROIプーリングアルゴリズム、特徴マップを使用します。

 

2 ROIプーリングの原則

ROIプーリング紙住所:  https://arxiv.org/pdf/1406.4729.pdf

また、空間ピラミッドプール(空間ピラミッドプーリング)と呼ばれるROIプーリング。 

画像サイズが変化するので、劣化した間接的認識精度がもたらされ、均一な大きさにした後、CNNにパンタグラフストレッチャを通過する必要があり、図出力異なるスケールはまた、ROIプーリングによって得られる固有ベクトル固定寸法であり、特徴づけることができます画像の特徴情報を、そして速いです。

__________________________________________________________________

 

3つのステップ

3.1 CNN事前訓練分類
3.2、CNNを変更、削除、最後の層及び後続の層を平坦化、ROIプーリング層置き換え
図は、2K選択selectivサーチ領域候補用いて得られた前記画像CNNを通して3.3
3.4 ROIプーリングいくつかのFC続い層、最後の二つの枝の出力:

  • 最初の分岐はソフトマックス層、K + 1つの出力カテゴリであります
  • 第二分岐回帰である、予測出力パラメータは、カテゴリK箱

 

理解するための4つの損失

 

なぜスムーズL1を使うのか?

2時以降: 

  • 午後12時誘導
  • より小さな損失、勾配を適切に低減することが、収束を促進します

 

R-CNNの性能と比較して5

おすすめ

転載: www.cnblogs.com/dxscode/p/11443752.html