ターゲット検出:R-CNNの原則

論文住所:

1件の選択検索:     https://arxiv.org/pdf/1502.05082.pdf

2、R-CNN:                     https://arxiv.org/pdf/1311.2524.pdf

1つの概要:
2Kの周囲に、窓、ターゲットを含有する候補ブロックの位置を特定するために用いられる選択的な検索方法を摺動による時間消費、及びこれによれば、2Kの、元のブロックを低減するために、順次CNNを訓練、切り出し

【選択検索]説明:図の進歩は、すなわち、ターゲットが発生することが候補領域(領域提案)を見つけます。画像テクスチャ、エッジ、色情報を使用することの少ない(数千または数百)を選択し、ウィンドウの場合には高い再現率(リコール)を維持するように確保することができます

 

ステップ2:
2.1 CNN事前訓練分類器imagenetに
2.2イメージ写真切り出すの選択的探索法を用い
た画像は、均一なサイズにリサイズ切り出し2.3
事前訓練CNNを用いて2.4に微調整を行い、全出力カテゴリNを+1、1はバックグラウンドを表し、この場合は十分CNNセーブ訓練され、小さいLRを必要とする
、出力として候補領域の各々をCNN層の最後の訓練された分類、中間体1次元の特徴ベクトルを除去するために2.5 2.4手順このCNN後の画像、ディスクへ出力特徴ベクトル記憶
順次(負例として正例IOU候補領域と> =候補領域0.3、他の実領域)SVMを訓練する各カテゴリの入力サンプルとして2.5特徴ベクトル
位置パラメータボックスの2.6リターン・ロスのトレーニングの目的

 

説明するためのボックスのリターンロス:

仮説予測モデルの出力D I = P(P(P)、X、P Y、P W、P H中央の)は、候補領域の幅と高さの座標、G =(G X、G Y、G W、G H中心が真の標的としての幅と高さ)の座標

 

1 L2正則化パラメータ値が超決定クロスバリデーションである、方法。

計算リターン損失に関与する2 IOU> = 0.6のみ候補領域のみ

 

3つの欠点
3.1選択サーチ処理が遅い
2K 3.2、繰り返され、冗長な情報が広い領域に存在する
3.3 4モジュール(選択検索、CNN、SVM、回帰)がそれぞれ分離されています

おすすめ

転載: www.cnblogs.com/dxscode/p/11443374.html