シーン分析中に発生した問題
ピラミッドプーリングモジュール
赤は最も粗いグローバルプーリングレイヤーを示します。
ピラミッドレイヤーの数と各レイヤーのサイズは変更できます。このホワイトペーパーのピラミッドプールモジュールは、サイズがそれぞれ1×1、2×2、3×3、6×6の4レイヤーモジュールです。
(B)ホールコンボリューション付きの事前トレーニング済みの再ネットネットワークによって取得され、そのサイズは入力サイズの1/8です。
ResNetベースのFCNの詳細な監視
上の画像は、詳細に監視されたResNet101モデルの例を示しています。最終分類子をトレーニングするためにソフトマックス損失(主分岐損失)を使用することに加えて、4番目のステージの後に別の分類子、つまりres4b22残差モジュールが使用されます。補助的な損失は学習プロセスの最適化に役立ちますが、主な枝の損失は最大の責任を負います。重量を増やして補助損失のバランスを取ります。テストフェーズでは、補助ブランチを放棄し、最適化されたメインブランチのみを最終予測に使用しました。