より高速なR-CNN紙のメモ

  論文住所:https://arxiv.org/abs/1506.01497

  後に高速R-CNNを提案し、メインのボトルネック削減目標の検出時間は、R-CNN誕生より速いので、コンピューティングの領域に選択されるようになりました。著者らは、新しいネットワーク構成、候補領域を得るために畳み込み一連のネットワークとして機能する、すなわちRPNを、提案し、高速R-CNNは実際組み合わせRPN +ファストR-CNNのように見ることができます。さらに、この層は、RPN部分畳み込み特徴マップは、畳み込み層が組み合わせて使用​​される生成されます。次のようにネットワーク構造は次のようになります。

  

            図1高速R-CNNネットワーク構造

  それは4つの部分に分割されている基本的な構造R-CNN、より速く。

  1.コンベンション層。またはvgg16 resnetにより、特徴マップを得ました。

  2. RPN。ROIを計算することによりスクリーニングした候補領域4K、および分類値2Kを与える畳み込み層と完全に接続された層(実際にはコンボリューションカーネルの畳み込み層1 * 1)により、ステップ1における特徴マップターゲット検出の後の使用のために一部の候補領域(関心領域)。

  3. ROIプール。特徴マップとRPNの関心領域が得られた入力の工程1で得られた、関心領域に対応する領域は、パターンROIプールすることによって得られた固定サイズのマップを備えています。

  4.ステップ3は、固定サイズのパターン分類結果及び損失を算出した総バウンディングボックス接続層による予測結果を与えると予測されました。


 

  RPN具体的な構成は次のとおりです。

  

            図2 RPNネットワーク構造。

  由图2可知,RPN先对feature map进行卷积核为3*3大小的卷积,得到512维(vgg处理中为512维而不是这里的256)新的特征图,然后再为新特征图的每一个像素点设置k(论文中为9,即为3种scale和3中aspect ration的乘积)个可能区域,所以2k个cls值即为在某特定scale和aspect ratio情况下对应的区域中,图像为目标的概率和其为背景的概率(2*k);4k个reg值即为在某特定scale和aspect ratio情况下对应区域的中心点坐标x、y和高宽h、w(4*k)。

 

おすすめ

転載: www.cnblogs.com/ylwn/p/10987479.html