R-CNNレンジ目標検出ボーエン要約高速R-CNN(理解)

R-CNN

[] R-CNN深い学習や個人的な論文読解

[] RCNN目標検出アルゴリズムは、詳細

R-CNN紙翻訳研究

要するに、R- CNN 2つの重要な要素の成功:
1 :物体の位置及びセグメンテーションのための候補領域に大きな畳み込みニューラルネットワーク(CNNs)のボトムアップ使用。
2:訓練データがタグ付けされると、最初の曲は、事前訓練を監視し、次に補助タスクの特定のタスクに、大幅な性能向上を得ることができます

簡潔に述べると、RCNNターゲット検出を達成するための4つのステップを次の
画像の中の1000年から2000年についてのAの決意フレーム候補
各候補フレーム画像ブロックのB、使用。深層ウェブ抽出する特徴
抽出された候補ボックスのC。使用機能分類器は、特定のクラスかどうかを決定する
D。と候補ブロックに属する特性を回帰さらに、その調整位置を

 

古典的なR- いくつかの問題CNNがあります。
トレーニング分割多重段階(第一のデータセットの分類に事前に訓練を受け、その後、ファイン - その後、チューントレーニングやカテゴリごとに線形SVM分類器を訓練し、最後と説明変数は、境界ボックスの回帰、および、選択的検索によって生成する必要があるバウンディングボックス)
時間オーバーヘッド大きな時間とスペースのオーバーヘッド(SVMのトレーニングとリターン入力として使用訓練する必要がディスクに保存されているフィーチャーネットワークの特性は、読み取りに比べ大)
の試験は、比較的遅い(各地域提案の各画像は、畳み込み演算があまりにも多く繰り返されなければならない)である
  高速RCNN前にR SPPnetを解決するために提案リピート畳み込み問題-CNNしかしSPPnetがまだ存在してR- CNN同様の欠陥:
トレーニング分割多重工程(SVM分類器は、追加の説明変数を必要とする)
大きな空間オーバヘッド

 

 

 FAST-CNN

高速R-CNN(理解)

ターゲット検出アルゴリズムの高速R-CNNの紹介

特徴抽出ネットワーク

 

改善

  • 畳み込みは、各領域の提案のための音、R-CNNは、コンボリューションであろう(この方法は、計算量を減らすこと、特徴一般化を抽出する前に、各領域の提案のために、しかし、画像全体に対して繰り返されませんダブルカウントの多くは)あります
  • 規模拡大の問題に提案された独創的なソリューションをROIPooling
  • ソフトマックス、よりシンプルかつ効率的と一緒にトレーニングをネットワークに、代わりにSVM分類器の回帰
次のように速いR-CNN主対象検出処理です。
(1)入力画像が検出されます。
(2)抽出候補領域:入力画像内の候補領域を抽出し、これらの候補領域を選択的検索アルゴリズムを用いて空間的関係の機能層に応じて、最後の畳み込みにマッピングされます。
(3)正規化:RoIのプーリング操作が固定特性寸法を得るために、候補領域特徴畳み込み層毎に行わ。
次いで、抽出された入力特徴完全接続層、及びソフトマックス、候補領域回帰の位置を分類するために使用される:(4)分類および回帰。
不十分:
抽出領域の提案はまだ選択検索を使用して、それに消費全体のテストプロセスのほとんどは、時間(2〜3秒程度発生領域の提案、のみ+ 0.32sの特徴抽出と分類)、この時点次々改善が高速化RCNNです。

 より速く、rcnn

速いRCNNキーポイント(推奨エリアネットワークRPN)コメント

 

おすすめ

転載: www.cnblogs.com/henuliulei/p/12112376.html