論文の解釈2 - 視覚認識のためのディープ畳み込みネットワークにおける空間ピラミッドプーリング

背景

  問題を検出する画像分類ConvNet法を解決する流行になるが、これらの方法は、第1の固定のW * hに画像のサイズを変更する必要があり、その後、ネットワークに投入、後の画像は、いくつかの情報が失われる可能性がありリサイズ。ネットワークは、任意のサイズの入力を受け入れることができるように、著者らは、SPPプーリング(空間ピラミッドプーリング)層を発明しました。

方法

  まず、私たちが知っているようConvNetは、入力映像の固定サイズを必要とする理由、コンベンション層のみ(写真3カラー、グレースケール1)固定チャネル必要が問題を考える、しかし、当然のことながら、ワットの出力を* hのワット任意の入力を取ることができます* Hの変化に追従するが、FCのバック層は、それは、入力として、固定長ベクトルをとり、画像サイズの変更 - >出力層CONVにサイズ変更 - >ベクトルの長さは、エラーを生成FC入力層を、変更します。

  どのようにこの問題を解決するには?最後の層のバックプラス層コンバージョンSPPプーリング層に提示される方法は、SPPプーリング入力変換層は、受信した出力の異なるサイズは、入力層FCの固定長を保証するために固定されてもよいです。

  

  各ビンにビン4 * 4,2 * 2,1 * 1に、図の特徴をそれぞれ* hであり、Wが与えられると、上記の動作をプールするため:示されているように、SPPプーリング層の原理は次のように非常に単純な例であります、最後に得た(本明細書で使用する最大プールである)16 * 256-D、4 * 256-D、特徴ベクトルの1×256-D、及び最終的に接続された(256-Dは、出力チャネル最後CONV層の数です)一緒に、その特徴ベクトル21 * 256-Dの取得。

  私たちは、どんなに多くのwとhの値の冒頭、見ることができ、最終的に入力FC層として固定長の特徴ベクトルを取得することができますので、ConvNetを入力として、画像の異なるサイズを受け入れることができるようになります。

概要

  FC層の前に層を追加することにより、著者SPPプーリング、ConvNetに効果的な解決策は、画像の固定サイズを受け入れなければなりません。

おすすめ

転載: www.cnblogs.com/xin1998/p/11371879.html