「ターゲット検出」ターゲット検出の概要

1.ターゲット検出方法の分類

まず、既知のターゲットに関する事前知識

この場合、ターゲットを検出する方法は2つあります。
(1)ターゲットの事前知識を使用して多数の弱い分類器をトレーニングし、次にこれらの弱い分類器が一緒に投票してターゲットを検出します。
(2)ターゲットと事前知識に基づく非ターゲット目標の最良の境界線

第二に、未知のターゲットに関する事前知識

現時点では、どのターゲットを検出するのかわからないため、ターゲットとは定義が異なります。
(1)シーン内の各ピクセルの顕著な確率をいくつかの特徴で表現するなど、シーン内の顕著なターゲットを検出し、顕著なターゲットを見つけます。
(2)シーン内で移動するターゲットを検出します。

2つ目は、従来の前面背景分離ターゲット検出方法です。

2.1 背景差分法

移動するターゲットを検出する際、背景が静止している場合は、現在の画像と事前に保存された背景画像を差として使用し、しきい値を使用して移動領域を検出します。これは動的ターゲット認識技術です。

背景差分アルゴリズムは、背景がわかっている状況に適していますが、長期的な静的背景モデルを自動的に取得する方法が困難です。

2.2フレーム差分法

ビデオシーケンス内の2つまたは複数の連続するフレーム間の差は、ターゲットの検出と抽出に使用されます。(動的に変化するシーンにより適しています)

動き検出の過程で、この方法は時間情報を使用して、画像内のいくつかの連続するフレームを比較することにより、対応するピクセルのグレースケール差を取得します。それらがすべて特定のしきい値T2より大きい場合、移動するターゲットがあると判断できます。この位置で。

2.3オプティカルフローフィールド法

2つの隣接するフレーム内の対応するピクセルのグレースケール保持の原理は、2次元画像の変化を評価するために使用されます。

動いている移動ターゲットの一部であっても、背景から関連する前景ターゲットをより適切に検出できます。これは、カメラの移動中に相対的な移動ターゲットを検出するのに適しています。

短所:オープニング問題、オプティカルフローフィールド制約方程式の解の非一意性問題。実際のスポーツ分野を正確に表現することはできません。

3.小さなターゲットを検出するための深層学習の一般的な方法

1.従来の画像ピラミッドとマルチスケールスライディングウィンドウ検出

  • ディープラーニング手法が普及する前は、さまざまなスケールのターゲットに対して、元の画像とは異なる解像度の画像ピラミッドを構築し、ピラミッドの各レイヤーに対して固定入力解像度の分類器を使用して、そのレイヤー上をスライドするのが一般的でした。ピラミッドの下部にある小さなターゲットを検出するか、元の画像を1つだけ使用し、異なる解像度の分類器を使用して元の画像上のターゲットを検出し、比較的小さなウィンドウ分類器で小さなターゲットを検出します。
  • 評価:ただし、この方法は低速です(ただし、通常、画像ピラミッドの構築は、畳み込みカーネル分離を使用するか、直接かつ単純かつ無礼にサイズ変更できますが、複数の特徴抽出を行う必要があります)、後で誰かがそのアイデアから借用して特徴を考え出しました融合のために異なるレイヤーの特徴を取得するピラミッドネットワークFPNは、1回の前方計算のみを必要とし、画像をスケーリングする必要はありません。また、小さなターゲットの検出にも使用されます。

2.シンプルで、粗雑で、信頼性の高いデータ拡張

  • 小さなターゲットを画像内の複数の場所にコピーすると、小さなターゲットに一致するアンカーボックスの数が増え、小さなターゲットのトレーニングウェイトが増加し、大きなターゲットに対するネットワークのバイアスが減少します。

3.特徴融合FPN

  • 異なる段階の特徴マップは異なる受容野に対応し、それらによって表現される情報の抽象化の程度は異なります。
  • 浅い特徴マップはワイルドで小さく感じられ、小さなターゲットの検出に適しています(大きなターゲットを検出するには、大きなターゲットの一部しか「認識」せず、効果的な情報だけでは不十分です)。
  • 深い特徴マップはワイルドに感じられ、大きなターゲットを検出するのに適しています(小さなターゲットを検出するには、バックグラウンドノイズが多すぎて冗長ノイズが多すぎます)。
  • 特徴ピラミッドネットワークFPN:ターゲット検出のパフォーマンスを向上させるためのさまざまな段階での特徴マップの融合。

4.適切なトレーニング方法SNIP、SNIPER、SAN

  • モデルの事前トレーニングの分布は、テスト入力の分布にできるだけ近づける必要があります。

5.より高密度のアンカーサンプリングおよびマッチング戦略S3FD、FaceBoxes

  • データセットが決定されている場合は、小さなターゲットを担当するアンカーの設定戦略を増やして、トレーニング中の小さなターゲットの学習をより完全にすることもできます。
  • さらに、ターゲットが小さいアンカーには、より緩いマッチング戦略(IoU> 0.4など)を使用することも一般的な方法です。

6.ズームインして検出するGANを生成します

7.コンテキスト情報を使用したリレーションネットワークとPyramidBox

第四に、ターゲット検出器の選択

  1. 小さなオブジェクトを検出する必要があり、速度を必要としない場合は、FasterR-CNNアルゴリズムを使用することをお勧めします。
  2. 速度が最も重要な場合は、YOLOアルゴリズムを使用する傾向があります。
  3. バランスの取れたパフォーマンスが必要な場合は、SSDアルゴリズムを使用することをお勧めします。

おすすめ

転載: blog.csdn.net/libo1004/article/details/110881739