[AI]注II:R-CNN物体検出原理と構造解析マスク

オリジナル紙住所:http://cn.arxiv.org/pdf/1703.06870v3

R-CNNマスク物体検出を高速R-CNNに基づいて、部品が増加し、いくつかの最適化を分割する目的は、具体的に説明します。

高速R-CNN以下は、ネットワークの構成図です。

 以下R-CNNをマスクするネットワークの構成図です。

高速次のようにR-CNNが変化に関してR-CNNマスク。

1. ResNet101抽出機能地図。

線形補間方法は、フレームの検出精度を高める用いRoIの整列を持つ2.あるいはRoIのプーリング。

オブジェクトセグメンテーションのための別個の層を追加マスク3。

       マスクR-CNNでは、画像は最初のFPNを介して入り、抽出された5つの層は、マップフィーチャー。ネットワーク構造を用いてFPN ResNet 101は、2×2の最大プーリングを得るようにする最終的な層のためにネットワークを介して受け継がれ、次いで上方合成機能、出力C2、C3、C4、C5層機能地図、C6れます。次のようにFPNが構成されています。

       第二段階は、FPNは20,000アンカーについて生成、RPNネットワークを通過するフィーチャを抽出し、1×1のCONV前景と背景の分類と補正対象フレーム座標後に行われた最初の3 * 3コンバージョンさらに特徴抽出とその後行います。切断対象ブロックの範囲外、小さな幅と高さのターゲットブロックの、及び前景スコア12000提案前面降順出力を除去します。最後に、NMSアルゴリズム、前回2000年の提案の出力と重複除外するための提案。

       RoIの整列フレーミング提案を使用する第3のステップは、均一なサイズの線形補間モード出力特性、分類器の最終出力、ターゲットブロックを通して特徴とマスク。

参考文献:

https://blog.csdn.net/ghw15221836342/article/details/79549387

https://blog.csdn.net/jiongnima/article/details/79094159

发布了28 篇原创文章 · 获赞 2 · 访问量 1万+

おすすめ

転載: blog.csdn.net/highlevels/article/details/98595829
おすすめ