(VII)R-CNNニューラルネットワークを理解します

地域提案

ここに画像を挿入説明
あなたはスライディングウィンドウの問題を解決することができます

候補領域(地域提案)

これは、事前に表示されることがあり、対象図形の位置を特定することです。なお、画像テクスチャ、エッジ、色情報はより少ない(数千または数百)を選択し、ウィンドウの場合には高い再現率(リコール)を維持するように確保することができる利用します。
RCNN(CNNの特徴を有する領域)地域提案による変換対象検出方法を実現するCNN良い特徴抽出と分類性能によりCNNの方法マイルストーンターゲット検出、です。

候補領域を選択します

地域の提案は、ここでは、もはやすることができ、従来の抽出法クラスエリアではありません窓から潜在的なターゲット画像を得るスライディング、スライディングウィンドウの異なる幅と高さとして見ることができ、あなたが提案SelectiveSearch上で見ることができ、2kのための一般的な候補者のオプション詳細な説明は、正規化、抽出されたターゲット提案に従って標準入力画像としてCNN。

CNNの特徴抽出

標準CNN処理、畳み込み/プールは、入力操作等に応じて、固定された寸法の出力を得ること

分類および回帰ボーダー

実際には二つのサブステップ、第一、分級工程の出力ベクトル(分類器を訓練する機能が必要)を含む、実際のターゲットが複数のサブ領域を生成することになるので、第二には、正確な標的領域境界回帰(バウンディングボックス回帰)により得られます、複数の検出を回避するために、正確な位置決めと統合オブジェクトフォアグラウンドの分類を完了することを目指しています。

図のステップに関連する抽出機能は
ここに画像を挿入説明
4つのステップに分かれて:
ここに画像を挿入説明

  1. 入力テスト画像
  2. 抽出に約2000リージョン提案から画像を使用して、選択的検索アルゴリズム
  3. FC7の特徴としてCNN、CNNの出力層に227x227の大きさと入力する各領域提案スケーリング(ワープ)
  4. 各地域の提案は、SVM分類にCNNの機能の入力を抽出します

RCNN三つの異なる問題が存在する:
トレーニングの複数段に分割し(1)、煩雑な手順:+ネットワークトレーニング訓練をトリミングSVM +回帰フレーム
候補領域に対応する複数の(2)は、トレーニング時間がかかるディスクを取りを事前に抽出された画像を必要とします空間:プロファイルの5000 G画像生成何百もの
オブジェクトを生成する(3)又は延伸切り捨てを引き起こす可能性がある情報入力CNN CNN従来の入力画像の損失は、固定サイズ、クロップ/ワープ(正規化)を必要とします;
( 4)試験は遅い:各候補は、CNNを計算する前に全体を実行する必要があります。CNNコンピューティングネットワークに入るの各ProposalRegionは、何千もの地域の多くは重複範囲、繰り返し特徴抽出計算巨大な廃棄物があります。使用GPUは、VGG16はモデル画像処理は、47Sを必要とします。
(5)SVMと付け足しを返す:回帰SVMとCNNの特徴の過程では、学習を更新されていません

ステップ

  1. 選択入力された画像の使用は、高品質の複数の提案領域を選択するためにSTART(選択検索)を検索します。これらの提案は、一般に、複数のスケールで領域を選択し、そして小異なる形状を有しており、ズームされています。各提案は、カテゴリや地域の実際のバウンディングボックスでマークされます。
  2. ⼀事前訓練畳み込みニューラルネットワークを開き、前出力層への切り捨てを選択します。変形領域の出力を計算する前方領域特徴抽出によって必要と提案各オファー入力STARTサイズオープンネットワーク。
  3. ⽀より多くのサポートベクトルマシン先タイムスケールの分類を訓練サンプル⼀としてその提案標識カテゴリと共に、各領域の特性。試料は⼀カテゴリを使用して属しているかどうかを決定するために、前記各⽀サポートベクトルマシン。
  4. 線形回帰モデルを訓練⼀サンプルとしてマークされ、そのバウンディングボックスと一緒に提案の各領域の特性は、真のバウンディングボックスを予測します。
公開された163元の記事 ウォンの賞賛117 ビュー210 000 +

おすすめ

転載: blog.csdn.net/u010095372/article/details/91147900
おすすめ