オリジナル紙住所:http://cn.arxiv.org/pdf/1703.06870v3
R-CNNマスク物体検出を高速R-CNNに基づいて、部品が増加し、いくつかの最適化を分割する目的は、具体的に説明します。
高速R-CNN以下は、ネットワークの構成図です。
以下R-CNNをマスクするネットワークの構成図です。
高速次のようにR-CNNが変化に関してR-CNNマスク。
1. ResNet101抽出機能地図。
線形補間方法は、フレームの検出精度を高める用いRoIの整列を持つ2.あるいはRoIのプーリング。
オブジェクトセグメンテーションのための別個の層を追加マスク3。
マスクR-CNNでは、画像は最初のFPNを介して入り、抽出された5つの層は、マップフィーチャー。ネットワーク構造を用いてFPN ResNet 101は、2×2の最大プーリングを得るようにする最終的な層のためにネットワークを介して受け継がれ、次いで上方合成機能、出力C2、C3、C4、C5層機能地図、C6れます。次のようにFPNが構成されています。
第二段階は、FPNは20,000アンカーについて生成、RPNネットワークを通過するフィーチャを抽出し、1×1のCONV前景と背景の分類と補正対象フレーム座標後に行われた最初の3 * 3コンバージョンさらに特徴抽出とその後行います。切断対象ブロックの範囲外、小さな幅と高さのターゲットブロックの、及び前景スコア12000提案前面降順出力を除去します。最後に、NMSアルゴリズム、前回2000年の提案の出力と重複除外するための提案。
RoIの整列フレーミング提案を使用する第3のステップは、均一なサイズの線形補間モード出力特性、分類器の最終出力、ターゲットブロックを通して特徴とマスク。
参考文献:
https://blog.csdn.net/ghw15221836342/article/details/79549387