R-FCN理解

 

参考ブログ:https://www.cnblogs.com/lillylin/p/6277094.html

R-FCN全体のプロセス:

  • そのようなResNet101、RPN(高速RCNNが来る)、予測の位置感応層、最終的なROIプーリング+投票意思決定としてCONVネットワークの基地

図示のように:

ここではマップが起動した機能、後続の処理を介してネットワークの特性から抽出された自分の絵のマップは、次のとおりです。

H * W * 2048(ResNet 101--オリジナルフルResNet101接続層の最後の層を除去し、×1024 1 * 1のフルボリュームに続く第一の層100を、留保:1は、それがネットワークサイズが前記ピクチャー得られるが想定されます図を得た積層体は、(出力層100はコンボリューション層1 * 1を再導入、次元削減のため、2048))×1024のH * Wの特徴。次いで、コンボリューションカーネルと示すように、H * W * Kを図特性における^ 2(C + 1)を得、K ^ 2(C + 1)* 1 * 1〜1024を畳み込みます。

 

図のK = 3で右の色特徴、前記図の厚さ。3 ^ 2 *(C + 1)= 9(C + 1)、9つのチャンクの総数、C + 1の厚さを有し、各チャンク。白四角でRPNを介してネットワークを表す図の機能上のターゲット領域にマッピングされました。提案されたマップの位置に敏感なスコアを取得するための9つのグリッド・アプローチに分け、ここで使用されます。

K = 3は、9箇所に対応し、ROIが3×3に分割されて表しは:(左上)、上側、右上、左、右に、左下、下中央を残し右下(右下)は、図中の対応する9 *(C + 1)特性ブロック。9(9色)の前に、各ブロックは、ROIの画像内の各ブロックに対応し、C + 1の厚さを有しますROIの位置は、次のような異なるセクションに分割され、ターゲットに対応する、9つの領域に分割されています。

图中小孩子对应的ROI区域划分成9块,分别对应小孩的身体的一部分,而映射到特征图中的的ROI,分成9块,这9块怎么得到呢? 如下图所示,这个ROI的左上角的区域,由厚度为9*(C+1)的特征图中的大红色部分得到,在整个红色块中,只取ROI所在位置的左上角的部分,而ROI 的上中部分,由红色后面的淡红色块中ROI所在位置的中上部分得到,依次可以得到ROI的右上角,中左,中中,中右, 下左,下中,下右(右下角)。

  这样就得到了ROI区域对应的H*W*(C+1)的score map, 然后经过一个ROI pooling,每个类别做一次,也就是有C+1个类别,每个类别 对应的3*3=9个区域,每个区域进行池化,得到3*3=9个值,共有C+1个类别,所以会得到3*3*(C+1)的feature map,然后每个类别对应的9个值再进行一个投票,得到一个值,共C+1个类别,所以会得到长度为C+1的特征向量,最后经过一个softmax得到分类结果。 

おすすめ

転載: blog.csdn.net/sinat_33486980/article/details/92143804
おすすめ