クラス認識およびクラス非依存の意味、違い、アプリケーションシナリオ
最初に公式の元の説明をしてください:
クラス対応
クラス対応の検出器の場合、画像をフィードすると、境界ボックスのセットが返されます。各ボックスは、内部のオブジェクト(犬、猫、車など)のクラスに関連付けられています。これは、検出器が検出を終了するまでに、どのタイプのオブジェクトが検出されたかを認識していることを意味します。
クラスにとらわれない
クラスにとらわれない検出器の場合、オブジェクトがどのクラスに属しているかを知らなくても、オブジェクトの束を検出します。簡単に言うと、「前景」オブジェクトのみを検出します。フォアグラウンドは広義の用語ですが、通常は、画像で検索する特定のクラスをすべて含むセットです。つまり、フォアグラウンド= {猫、犬、車、飛行機、…}です。検出したオブジェクトのクラスがわからないため、クラスに依存しないと呼びます。
個人的な理解:
クラス認識の入力は画像であり、返されるのは、検出する必要のある各クラスに対応するbboxです。つまり、検出器が検出を完了すると、検出された各bboxがどのクラスに属しているかもわかります。
クラスにとらわれない入力は画像であり、返されるのはオブジェクトのグループですが、このグループの各オブジェクトがどのカテゴリに属しているかは不明です。つまり、前景と背景のみを検出できます。
クラスにとらわれない検出器は通常RPNに使用されます。検出器の後に、各カテゴリを検出するために特別な分類器が必要です。