背景
深いConvNet上昇、好調に画像分類タスクで使用VGG16、検査タスクを解決するために、この紙VGG16。欠点CNN層の前に訓練の方法ができない微調整SPP NET、およびいくつかの段階、特徴抽出+ SVM分類+フレーム復帰に分けられ、高速R-CNNで、これらの問題が解決されました。
方法
ネットワークモデルは、SPP NETと比較して以下の改善で、VGG16構造を採用します。
ROIプーリング
最終層は、ROIが最大プーリング層をプール置換され、SPP NETの特殊な場合と考えることができる、ピラミッドの一層のみ、特徴マップは、最大プールとして、ビンのH *のWに分割されます。
BBOXの回帰
それぞれ、完全に接続された層を使用して2つの異なるネットワークを終了し、出力ソータ位置結果、エンド・ツー・エンドのトレーニングプロセスを達成しました。
CNNsパラメータ更新
実際には、SPP NETはまた、パラメータCNNsを更新していないのではなく、その費用は、SPPのNETは、最初にランダムに崩壊のトレーニングの後ROI、Nチャンの写真の束を模索しますので、ROIは、多くの異なるから来るかもしれない、高すぎますあなたがスプレッドを逆にしたい場合は、あなたがトレーニングを保存する必要がありますので、画像は、各レイヤーマップでこれらの写真を備えています、巨大なオーバーヘッドは、速いR-CNNは、唯一のオリジナルR = 2張は、N ROIを取るには、階層的な思考を使用していますこのような記憶が2コマだけを使用して計算され、コストが大幅に削減されます。
概要
それがされ、エンドツーエンドの中にSPP NETの改善、トレーニングプロセスに基づいて行われ、全体のネットワークパラメータを更新することができます。
短所
ROIの抽出に使用される方法またはSS。