物体検出: RPN — より高速な R-CNN のバックボーン

小さな手を動かして大金を稼いで、親指を立ててください!

R-CNN を使用した物体検出では、RPN が実際のバックボーンであり、これまでに非常に効果的であることが示されています。その目的は、特定の画像内で認識可能な複数のオブジェクトを提案することです。

このアプローチは、Shaoqing Ren、Kaiming He、Ross Girshick、および Jian Sun によって、非常に人気のある論文「Faster R-CNN: Towards Real Time Object Detection with Regional Proposal Networks」で提案されました。これは、多くのデータ サイエンティスト、深層学習、人工知能エンジニアの注目を集めている非常に人気のあるアルゴリズムです。自動運転車内の物体の検出、さまざまな能力を持つ人々の支援や支援など、巨大な用途があります。

1. CNN とは何ですか?

CNN は畳み込みニューラル ネットワークに翻訳されます。これは非常に人気のある画像分類アルゴリズムであり、通常、多くの特徴を失わずに次元を削減するために畳み込み層、活性化関数層、プーリング (主に max_pooling) 層で構成されます。この記事[1]では、最後の畳み込み層によって生成された特徴マップがあることを知っておく必要があります。

たとえば、猫の画像または犬の画像を入力すると、アルゴリズムによってそれが犬であるか猫であるかを判断できます。

しかし、それだけではありません。大規模なコンピューティング能力が大きな進歩をもたらしました。

多くの事前トレーニング済みモデルは、計算上の制約によるモデルのトレーニングという苦労をせずに、直接使用できるように開発されました。VGG-16、ResNet 50、DeepNet、ImageNet 用の AlexNet など、多くのモデルも人気があります。

この記事では、上記の論文から導き出された、本当に賢いアルゴリズムやアイデアであると私が考えるものについて特に話したいと思います。多くの人がオブジェクトを認識するために Faster R-CNN を実装していますが、これは、アルゴリズムが認識されたオブジェクトの周囲にボックスを取得する方法の背後にあるロジックと数学に特に焦点を当てています。

このアルゴリズムの開発者は、これを「Region Proposal Networks」(RPN と略します) と呼んでいます。

オブジェクトが配置されている領域に関するこれらのいわゆる「提案」を生成するために、小さなネットワークが最後の畳み込み層の出力である畳み込み特徴マップ上をスライドします。

alt

以上是 Faster R-CNN 的架构。 RPN 为对象生成建议。 RPN 本身具有专门且独特的架构。我想进一步分解RPN架构。

alt

RPN 有一个分类器和一个回归器。作者引入了锚点的概念。 Anchor 是滑动窗口的中心点。对于作为 AlexNet 扩展的 ZF 模型,尺寸为 256-d,对于 VGG-16,尺寸为 512-d。分类器确定具有目标对象的提议的概率。回归对提案的坐标进行回归。对于任何图像,比例和纵横比都是两个重要参数。不知道的朋友,纵横比=图片的宽度/图片的高度,scale就是图片的大小。开发人员选择了 3 种比例和 3 种纵横比。因此,每个像素总共可能有 9 个建议,这就是 k 值的决定方式,对于这种情况,K=9,k 是锚点的数量。对于整个图像,anchors 的数量是 WHK。

该算法对平移具有鲁棒性,因此该算法的关键属性之一是平移不变性。

算法中多尺度锚点的存在导致“锚点金字塔”而不是“过滤器金字塔”,这使得它比以前提出的算法(如 Multi-Box)更省时且更具成本效益。

2. 它是如何工作的 ?

这些锚点根据两个因素分配标签:

  1. Intersection-over-union 最高的锚点与地面实况框重叠。
  2. Intersection-Over-Union Overlap 高于 0.7 的锚点。

归根结底,RPN 是一种需要训练的算法。所以我们肯定有我们的损失函数。

alt

i → anchor 的索引,p → 是否是物体的概率,t → 预测边界框的4个参数化坐标的向量,*表示ground truth box。 cls 的 L 表示两个类的对数损失。

alt

损失函数中带有回归项的p确保当且仅当对象被识别为是时,则只有回归才算数,否则p将为零,因此损失函数中的回归项将变为零。

Ncls 和 Nreg 是归一化。默认情况下,λ 默认为 10,用于在同一级别上缩放分类器和回归器。

如果您想更详细地了解,这里是论文的链接:https://arxiv.org/pdf/1506.01497.pdf。

Reference

[1]

Source: https://medium.com/egen/region-proposal-network-rpn-backbone-of-faster-r-cnn-4a744a38d7f9

本文由 mdnice 多平台发布

おすすめ

転載: blog.csdn.net/swindler_ice/article/details/130978360