高速追跡方法

I.はじめに

カメラのフォーカストラッキング、自動ターゲット追跡ドローンので、トラッキング技術を使用する必要があります:ターゲット追跡は、以下のようなアプリケーションの非常に広い範囲を持っている、コンピュータビジョンの最もホットな分野の一つです。また、このような人間のトラッキング、交通監視システム、車両追跡、顔追跡及びインテリジェントインタラクティブシステムジェスチャ追跡などの特定のオブジェクトの追跡があります。

過去数十年にわたり、目標追跡技術はかなりの進歩を遂げています。特に近年では、深い学習、満足のいく結果にアクセスするだけでなく、トラッキング技術作られている方法、が増えての出現の物体追跡方法の出現で突破口をしました。

本論文で主な内容は次のとおりです。目標追跡関連のデータとそのアプリケーションを追跡する基本的なプロセスとフレームワーク、高速でターゲットを。

私は、この論文は、方法に関連し、原則はより良い理解を持っている目標追跡のより包括的な理解を持っている読者を助けることを願っています。

 

第二に、基本的なプロセスや目標追跡フレームワーク

トラッキングタスクにターゲット(単一のターゲット)は、後続のフレーム内の目標位置の予想サイズで、ビデオフレームシーケンス初期目標サイズと位置が与えられます。

この基本的なタスクの一般的な方法は、以下のフレームワークに応じて分割することができます。

入力は、特徴候補ブロック(特徴抽出)を抽出、次のフレームでの候補フレームの数(モーションモデル)を生成するために、ターゲットフレーム(初期フレーム)を初期化し、その後、最終的にはこれらの得点に基づいて候補フレームレート(観察モデル)について見出さ対象候補フレーム(予測A)の最高得点は、より良い予測対象を与えるために、予測値又は融合複数の(アンサンブル)を予測しました。

上記の枠組みによれば、我々は標的とすることができる主な内容は、グループ分けトラッキング5つの領域

(1)運動モデル:候補サンプルの数を生成する方法。

(2)特徴抽出:対象地物の使用を示しています。

(3)観測モデル:どのように多くの候補者のサンプルを獲得します。

(4)モデルの更新:観察された変化適応目的にモデルを更新する方法について説明します。

(5)統合されたプロセス:決定の複数を得るように意思決定を統合する方法は良好な結果。

以下は、5つの研究の簡単な紹介です。

動きモデル(運動モデル):候補速度と品質を直接追跡システム性能のメリットを決定するサンプリング生成します。2つの一般的な方法がある:粒子フィルタ(パーティクルフィルタ)およびスライディングウィンドウ(スライディングウィンドウ)。粒子フィルタは、逐次ベイズ推論法、再帰的状態によって暗示目標推論です。そして徹底的な検索のスライディングウィンドウ法は、候補サンプルとして標的サンプルのすべての周辺を一覧表示することが可能です。

特徴抽出(特徴抽出):表現の特性の識別は、キーターゲット追跡の一つです。共通の特徴は、2つのタイプに分けられます。特性の手のデザイン(手作り機能)と深さ特性(ディープ機能)。従来の手動設計の特徴が持つ特性階調(グレー)、方向ヒストグラム(HOG)を、ハール状機能(ハール状)、スケール不変特徴(SIFT)等が挙げられます。そして、人によって設計されたさまざまな機能には、トレーニング多数のサンプルを介して学習の深さは、それが差別的特徴を有するマニュアル設計以上であることを特徴とすることを特徴とします。このように、特徴追跡方法の深さで、通常は簡単に良い結果を得ることができます。

観測モデル(観察モデル):追跡方法のほとんどは、デザインのこの作品に焦点を当てました。さまざまなアイデア、観測モデルは、2つのカテゴリに分けることができる:式モデル(生成モデル)と判別モデル(判別モデル)。生成モデルは、通常のテンプレート最も類似候補追跡結果として、ターゲットを見つけ、このプロセスは、テンプレートマッチングとして見ることができます。一般的に使用される理論的なアプローチが含まれます:部分空間スパース表現辞書学習ようにしています。そして、ターゲットと背景を区別するために、分類器を訓練を通じて差別のモデルは、予測結果として最も高い信頼候補サンプルを選択します。機械学習方法の多くは使用することができますがありますので、判別方法は、目標追跡のための主流の方法となっています。ロジスティック回帰、リッジ回帰、サポートベクトルマシン、マルチインスタンス学習関連フィルタリング:一般的に使用される方法は理論を含みます。

モデル更新(モデル更新):メインモデルの更新は、トラッキングプロセスがドリフトを防止するために見かけ上のターゲットの変化に適応するために、モデルの観察を更新することです。モデルの更新は、一般的にそれほど頻繁に一度フレームモデルを更新し、連続的な変化の明白な目標と考え、統一規格ではありません。しかし、他の人が過去の見かけ上のターゲットが追跡のために重要であると信じて、継続的に更新された情報が明らかに過去、あまりにも多くのノイズを導入するので、この問題に対処するアップデートを組み合わせるの短期および長期の方法を使用することがないことがあります。

統合方法(方法、アンサンブル):統合されたアプローチは、モデルの予測精度を向上させるのに役立ちます、それはまた、多くの場合、追跡精度率を向上させる有効な手段として見られています。最良の予測変数の選択された複数の、または予測のすべての加重平均を使用する:統合されたプロセスは、緩く二つのカテゴリーに分けることができます。

 

第三に、高速なターゲット追跡方法

テンプレートマッチング

テンプレートマッチングは、ターゲットを追跡する古典的な方法であり、その利点がある:単純、正確、幅広いアプリケーション、優れたノイズ耐性、および高速計算。欠点は、ターゲットであると照明深刻な変形の劇的な変化に適応することはできません。

テンプレートマッチングは、テンプレートとほとんどの場所のようなゴールである場所にターゲットテンプレート画像を見つけることを指します。見つけるために限り、サブ領域と対象テンプレートフルマップなど、すべての比較、ターゲットテンプレートのほとんどのサブ領域のように、それは、ターゲットの位置です。どのように量子地域の類似度とターゲットテンプレートそれ?最も簡単な方法は、2の相関係数を計算することです。

相関係数(r)は、数学的距離であり、2つのベクトルの類似度を測定するために使用することができます。2つのベクトル間の角度が0度(R = 1に対応)である場合、90度(角度場合は、それらが正確に同様の指示、余弦の法則:.コス(A)=(A2 + C2-B2)/ 2BC由来しました角度が180度(R = -1)の場合、R = 0)、それらは完全に異なるされ、それらは正反対です。の形式で記述された余弦ベクトルの法則:

COS(A)= <B、C> /(| B | * | C |)、

即:COS(A)=(B1C1 + b2c2 + ... bncn)/ SQRT [(B12 + B22 + ... + BN2)(C12 + C22 + ... + CN2)]

分子が2つのベクトルの内積を表し、分母を乗算する2つのベクトルの係数を表します。

実際には、より一般的に基づいて、式中の分子と分母における各ベクトルの相関係数が、それにもマイナスの平均値を意味するために使用されます。

 

したがって、ベクトルの2つの類似部分が減算され、その相関を増幅しました。

標的テンプレートが10×10の画像であると仮定すると、それは100次元のベクトル、画素の各次元の階調値と見なすことができます。各サブ領域このベクター画像は、サブ領域の最大相関係数、検索する対象の位置を特定するために比較されます。

TLD

TLDアルゴリズムは、主に3つのモジュールから構成されていますトラッカー(トラッカー)、検出器(検出器)と機械学習(学習)。

ビデオトラックのために、一般的に使用される2つの方法があり、一つは、場所に次のフレームの予測におけるその位置に応じてオブジェクトを追跡するために使用されるが、この誤差が蓄積し、画像中のオブジェクトの消失一度、トラッカー永久にオブジェクトが再びトラックを完了できなかった場合でも、失敗します。別の方法だけでは、各フレームの処理対象物の位置を検出する検出器を使用することですが、彼らは、検出器上のオフライン訓練を進める必要がある、それだけで追跡するために使用することができますオブジェクトが事前に知られています。

TLDは、長い時間のために、未知の物体追跡アルゴリズムのビデオです。「未知のオブジェクトは、」任意のオブジェクトを指し、我々は対象とした場合のトラックの開始前に知りませんでした。「ロング・トラック」とリアルタイムの計算アルゴリズムの必要性を暗示するが、オブジェクトの追跡の途中で再び消失するが、光の変化と、背景とによる時々部分的閉塞にすることができる、オブジェクトは、ピクセル「ルック」に反映させることができますそれは多くのことを変更します。

オブジェクトが可視トラッカーが有効になり、常にときトラッカーの役割は、連続したフレームの動きを追跡しています。追跡は、現在のフレームにおける既知の以前の位置推定値であり、これは対象物運動軌道につながる、軌道はこの陽性サンプル(Tracking->学習)から生成することができるオブジェクトに係る学習モジュールです。

偉大なトラッカーの結果にエラー訂正あれば検出器の役割は、トラッカーエラー推定されています。対象物の位置を見つけるために、包括的なスキャンを与えるために、各フレームの検出は、学習モジュール(Detection->学習)に、検出結果から生成された全ての生成された正及び負のサンプルの外観に類似しています。フレームTLDの出力結果として、すべての陽性試料の最も信頼できる場所から選択されたアルゴリズム、およびこの結果を使用して初期位置追跡(Detection->トラッキング)を更新します。

学習モジュールと検出器によって生成される追跡陽性および陰性サンプル、クラシファイア反復トレーニング、検出器(Learning->検出)の精度を向上させます。

オプティカルフロー法(ルーカス-Kannade)

オプティカルフロー法原理:変更された画像シーケンスの時間領域の画素を用いて、隣接するフレーム間の現在のフレームの一つとの対応関係の存在との間の相関を見つけるために、それによって隣接するフレーム間のオブジェクトを計算します動き情報。

不変のシーンの輝度で追跡される物体の一部;仮定

仮説2:動きがフレームレートに遅い相対的であり、一貫性の数式は、連続を意味する、誘導可能。

3つの仮定:全画素の隣接近傍δの速度を維持するために隣接する点(U、V)は等しいです。

より一貫性の大きな動きのない最も30Hzのカメラ、実際にオプティカルフロー法LK悪いトラック性能、大きな動きを捕捉するために、通常は大きな窓が、運動の連続性が、それが導入されることを前提に、多くの場合、逆の場合画像ピラミッド。

出発点として、ピラミッドの次のレベルを取得した動き推定結果と画像ピラミッドの最高レベルでのオプティカルフローの計算は、プロセスは、ピラミッドの底に到達するまで繰り返されます。この可能性は、より速く、より長く運動を達成するために、モーショントラッキングを最小限にするための前提条件を満たしていません。

このアルゴリズムの欠点は、それが非常に高いフロー密度量、例えば、動きの点でエッジのわずかな動きと迅速退色大黒面積均一なフロー情報を生成することができないということです。これは、雑音耐性の存在が可能であるという利点を有します。

第四に、アプリケーションの効果速いターゲット追尾モード

  • 元の画像サイズは640×480であります
  • インテル(R)Xeon(R)CPUのX5660する@ 2.80GHz

ターゲット追尾モード

元の画像サイズ

1/2

1/4

1/6

テンプレートマッチング

40msの

11ms以下まで

3.8ms

2msの

TLD

9ms

4.5ms

3.6メートル

3.5ms(無効)

オプティカルフロー

4MS

2.5msで

1.8ms

1.2ms以上(無効)

 


 

zeusee.com  Zhiyunビュー

おすすめ

転載: www.cnblogs.com/huiwei13/p/11797129.html