高速R-CNN - 紙検出対象3の解釈

背景

  深いConvNet上昇、好調に画像分類タスクで使用VGG16、検査タスクを解決するために、この紙VGG16。欠点CNN層の前に訓練の方法ができない微調整SPP NET、およびいくつかの段階、特徴抽出+ SVM分類+フレーム復帰に分けられ、高速R-CNNで、これらの問題が解決されました。

方法

  ネットワークモデルは、SPP NETと比較して以下の改善で、VGG16構造を採用します。

  ROIプーリング

  最終層は、ROIが最大プーリング層をプール置換され、SPP NETの特殊な場合と考えることができる、ピラミッドの一層のみ、特徴マップは、最大プールとして、ビンのH *のWに分割されます。

  BBOXの回帰

  それぞれ、完全に接続された層を使用して2つの異なるネットワークを終了し、出力ソータ位置結果、エンド・ツー・エンドのトレーニングプロセスを達成しました。

  CNNsパラメータ更新

  実際には、SPP NETはまた、パラメータCNNsを更新していないのではなく、その費用は、SPPのNETは、最初にランダムに崩壊のトレーニングの後ROI、Nチャンの写真の束を模索しますので、ROIは、多くの異なるから来るかもしれない、高すぎますあなたがスプレッドを逆にしたい場合は、あなたがトレーニングを保存する必要がありますので、画像は、各レイヤーマップでこれらの写真を備えています、巨大なオーバーヘッドは、速いR-CNNは、唯一のオリジナルR = 2張は、N ROIを取るには、階層的な思考を使用していますこのような記憶が2コマだけを使用して計算され、コストが大幅に削減されます。

概要

  それがされ、エンドツーエンドの中にSPP NETの改善、トレーニングプロセスに基づいて行われ、全体のネットワークパラメータを更新することができます。

短所

  ROIの抽出に使用される方法またはSS。  

 

おすすめ

転載: www.cnblogs.com/xin1998/p/11374221.html