物体検出は、画像やビデオから特定の対象物体を正確に検出して位置を特定することを目的とした、コンピューター ビジョンの分野における重要なタスクです。
1. ターゲット検出問題の定義
オブジェクト検出は、画像内のさまざまな数のオブジェクトを見つけて分類するプロセスです。
2. ターゲット検出プロセスでよくある問題
- ターゲットの種類と数量の問題
- 目標規模の問題
- 外部環境干渉の問題
3. ターゲット検出と画像分類の違い
ターゲットの検出:
ターゲット検出では、長方形の枠 (つまり、ターゲット検出オブジェクトの位置) が 提供されるだけでなく、長方形の枠内のオブジェクトが分類されます。長方形の枠の異なる色は、異なるカテゴリを表し、検出オブジェクトがターゲット カテゴリに属していることを示します。信頼レベル。
画像分類:
画像分類は主に画像を入力として使用し、異なるカテゴリに属する画像の確率分布を出力として使用し、主に画像のカテゴリを決定します。画像分類はターゲット検出の一部にすぎません。
要約:
画像分類であろうとターゲット検出で あろうと、処理にディープ ラーニング テクノロジを使用する場合、特徴抽出ステップが必要です。古典的な機械学習手法の場合、特徴抽出は通常、手動の特徴を設計することで完了しますが、ディープ ラーニングでは多くの場合、ボリュームが使用されます。畳み込みニューラル ネットワークは、特徴を抽出するために使用されます。
4. ターゲットの検出 VS ターゲットのセグメンテーション
ターゲットの検出:
主に対象物の位置を特定する場合、位置情報は通常長方形で表され、この長方形は4次元データで表すことができる。
ターゲットのセグメンテーション:
各ピクセルは異なるカテゴリに分割され、分割結果は元の画像のサイズと一致する必要があり、多くの場合、アップサンプリングまたはデコンボリューションによって元の画像と同じサイズの出力結果が得られます。
- 画像分類:対応するターゲットが属するカテゴリを指定するだけ
- ターゲットの検出:ターゲットを見つけて分類する必要がある
- ターゲットのセグメンテーション: 現在のターゲットが占める領域を見つける必要があります。上の図 c はセマンティック セグメンテーション、d はインスタンス セグメンテーションです。
- セマンティック セグメンテーション: 同じ種類のオブジェクトが占める領域を見つけるだけで済みます。
- インスタンスのセグメント化: 異なるセマンティック レベルのターゲットを区別する必要があるだけでなく、同じカテゴリのターゲットを異なるインスタンスに分割する必要もあります。
ターゲット検出アルゴリズムの開発プロセスでは、かつては手動機能に基づく従来のアルゴリズムが主流でした。これらの従来のアルゴリズムは、Haar 特徴、HOG 特徴、SIFT 特徴など、手動で設計された特徴を設計および抽出することにより、ターゲット オブジェクトを識別します。
この記事では、ターゲット検出アルゴリズムの手動機能に基づく従来のアルゴリズムを深く調査し、その原理、長所と短所、およびコンピュータ ビジョンへの応用を紹介します。
1. 手動特徴に基づく従来のターゲット検出アルゴリズムの定義
手動特徴に基づく従来のターゲット検出アルゴリズムは、手動で特徴を設計および抽出することによってターゲット オブジェクトを識別する、初期のタイプのターゲット検出アルゴリズムです。これらの特徴は通常、エッジ、テクスチャ、色などの画像のローカル情報に基づいています。従来のアルゴリズムは通常、特徴抽出に基づいて分類器または検出器を使用して、画像内にターゲット オブジェクトが存在するかどうかを判断し、ターゲットの位置とサイズを示します。