CVPR 2016ビデオオブジェクトセグメンテーションの研究論文

 

あらましビデオオブジェクトセグメンテーション、二値ラベリング
問題は、オブジェクトの追跡など、さまざまな用途で重要です
動作認識、ビデオ要約、ビデオ編集、オブジェクト
ベースの符号化およびビデオ 検索(检索)。 本論文では、提示します
ビデオオブジェクトの最近の戦略の概要 セグメンテーション(分类)
複雑なような課題を解決するための技術に焦点を当て
背景を移動し、 照明(光/照度) 変更、 閉塞(閉塞)
モーションブラー(モーションブラー) 、シャドウ効果変動とビューポイント。重要
近年、この研究分野で進化した作品であります
研究者によって解決課題に基づいて分類しました。A
挑戦的なデータセットと評価の一覧 メトリクス(指标) のために利用可能
ビデオオブジェクトセグメンテーションが提示されます。での最後に、研究ギャップ
この ドメインは(领域) で議論されています。
要約:ビデオ分類、ビデオクリップ、ビデオ符号化およびビデオベースのセグメンテーションアルゴリズムを検索する重要な方法でどのようなオブジェクトの追跡、モーション認識などの分野、様々な。
本論文では、複雑なモバイルバックグラウンドの照明の変化、閉塞品、モーションブラー、影の変化の問題、および視点を解決するために主に、最近のビデオセグメンテーションアルゴリズムの戦略を提示します。
関与この重要なペーパーワークや課題は多くのカテゴリに分類され、それと同時に、彼はまた、学ぶために、データ・セットおよび評価を提供し、最終的に、彼はまた、この分野不一致点を議論しました。
最近のインターネットの世界は、膨大な量に従事しています
ビデオデータストレージデバイスでの開発のおかげと
便利なイメージングシステム。巨大な テラバイト(兆字节) ビデオのは、定期的にあります

以下のような種々の有用な用途のために生成されたサーベイランス(监控)

等に基づいてニュース放送、遠隔医療、
「ビジュアルネットワーキングインデックスにCISCOによって提供される情報
(VNI)」、インターネットビデオトラフィックの成長は3倍になります
2015年から2020年を手動で抽出する セマンティック(语义) 情報
インターネットのこの膨大な量の映像は非常にあります
に自動化された方法の必要性を求めて、実現不可能
注釈を付ける(コメント)/(輸出)を導出 ビデオでのデータから有用な情報
ビデオ管理及び検索[1]。したがって、のいずれか
ビデオ処理や検索のための重要なステップは、ビデオです
オブジェクトセグメンテーションのためのバイナリラベリング問題
から正確にフォアグラウンドオブジェクトを区別します
バックグラウンド。ビデオオブジェクトセグメンテーションを目指す パーティショニング(分离)
フレーム(帧) グルーピングすることにより、意味のあるオブジェクトにビデオで
画素に沿って 時空間(時間と空間)  方向その展示に
外観及び動きに一貫[2]。Videoオブジェクト
セグメンテーションタスクが原因以下のものに非常に困難です
理由:(I)、ビデオ内のオブジェクトの数が不明(ⅱ)変化
複数のオブジェクトのビデオおよび(iii)発生中の背景
ビデオでの[3]。ビデオセグメンテーション缶内の既存のアプローチ
大まかに二つのカテゴリーに分類されるすなわち、インタラクティブ(交互式)
この方法は、 教師なし(教師なし) メソッド,.インタラクションオブジェクト
初期設定での分割方法人間の介入
教師なしアプローチは、オブジェクトを実行することができながら、工程
セグメンテーション自動的に。半教師のアプローチでは、
ユーザーの介入は、最初のフレームに注釈を付けるために必要であり、
これらのアノテーションは、全体のフレームに転送され、
ビデオ。自動オブジェクトセグメンテーション手法[7] [8] [9]
することができずに意味のあるオブジェクトにセグメント任意のビデオデータ
オブジェクトの提案やモーションキューに基づいてユーザとの対話
ビデオから。のほとんどが続く一般的な仮定
自動化された方法は、単一のオブジェクトが移動していることです
ビデオおよび使用のためにのみ動き情報を通して、
背景からオブジェクトをセグメント化します。この仮定
の不連続運動の下で貧しいセグメンテーションにつながります
オブジェクト[11]。文献を参照[12] [13] [14] [15]のために
説明ビデオオブジェクトセグメンテーションに関する調査
画像セグメンテーションのために利用可能な技術ではなく、ビデオへ
データ。[15]著者でビデオにアプローチを分類
推論や機能モードとしてセグメンテーション。ザ・
セグメント化技術は、改善するために、これまで提案しています
セグメンテーション結果は、推論モードとしてグループ化され、
深さ、運動などの機能に依存した方法
ヒストグラムは、機能モードと呼ばれています。この観察から、
研究者のいずれも議論していないことが明らかです
の観点から、セグメンテーションアプローチ
アルゴリズムによって解決課題。したがって、本論文
の研究者によって寄与重要な仕事は、分類します
で解決される問題に基づいて、ビデオオブジェクトセグメンテーション
それぞれの作家。セグメンテーションを低下させるいくつかの問題
パフォーマンスは、カメラを移動、地面に戻って移動しています、
照明変化、オクルージョン、シャドウ効果、視点
変化、等。また提案されたアルゴリズムべき 
セグメンテーション精度との間のトレードオフを提供します
複雑。図に示すように。1、この論文では分類し
ビデオオブジェクトセグメンテーションタスクとして:
1.問題に取り組むモード
2.複雑さの低減モードと
3.推論モード
本論文の主な貢献は以下のとおりです。
Xビデオオブジェクトの最近の活動をまとめます
セグメンテーションドメイン。
この研究の重要な作品を分類するX
フィールド有意義と
データベースと評価メトリクスのリストを提示X
効率的なビデオオブジェクトを開発するために必要な
セグメンテーションフレームワーク。
本論文の構成:第IIは、アルゴリズムを説明します
(問題に取り組むに大きく貢献議論
以前の)ビデオオブジェクトセグメンテーションに関与。セクションIII
セグメンテーションはと近づきに概要を説明します
文献で利用可能な複雑さの低減。セクションIVが提供します
該当オブジェクトセグメンテーション技術上の要点
推論モード。セクションVは、データセットと評価を示しています
これらのセグメント化アプローチと議論しに使用されるメトリック
ビデオオブジェクトセグメンテーション分野での研究ギャップについて。
セクションIVは、本研究を終了します。
 
最近、私たちのオンラインの世界では、ビデオの様々な情報でいっぱい。、それはあなたにとって非常に重要であるあなたを伝えるために言葉の大部分との一言で、その後それが私たちの目的です(ビデオセグメンテーションアルゴリズム)推定(ハーモニービデオ内のオブジェクトの動きを示しており、ビデオの各フレームから分離されています一貫性)、しかし、ビデオ部門は、次のような困難があります。
1.私は、ターゲット・オブジェクト・ビデオである何かわかりません
2.変更の背景
3.複数のターゲットオブジェクト
今、主に二つの方法:インタラクティブ、教師なしの方法。もちろん、我々はこの記事教師なし方法、ビデオオブジェクトの自動セグメンテーション確信しています。
半教師学習法では、フレームの初期化が始まり、そして我々は、オブジェクトが確かに必要で分割したいが、これを必要としない教師なしの方法は、今と想定されているビデオセグメンテーションアルゴリズムがたくさんあるだけで、単一のオブジェクトのオブジェクトモバイルではなく、連続的に移動する目標時間の顔は、悪影響につながります。著者は、15引用して、ビデオセグメント化アルゴリズムはに基づいて、「すべきであると信じている 特徴抽出と結論づけ 、」指数はおよそ12-15で画像分割の方法をまとめたもの。現在の観察に基づいて、非常に少数の人々は、したがって、この記事では、光の変化、カメラを動かし、そのような背景の移動などのビデオセグメンテーションの精度を低下させる可能性のある問題のいくつかをまとめたもので、視点からのビデオセグメント化アルゴリズムの方法をまとめ明確です、シールド、シャドウ効果、視野角が変化します。
さらに、この記事で提案するアルゴリズムは複雑さとアルゴリズムの精度の間のトレードオフを検討します。
そこで、この記事では、アーキテクチャです。
1.解決アプローチ
2.複雑さの軽減
干渉の前記分析
この記事3の主要な貢献:1は、メソッド、現在使用される分類3. 2.この分野での最近の仕事は練習する読者のために、いくつかのデータセットとデータ標準を提供しまとめたもの。
II。ISSUEのタックルのMODE
「問題に取り組むモード」についてのこのセクションの詳細を、最初の
ビデオオブジェクトセグメンテーションアプローチのカテゴリ。にもかかわらず
(前述のように)いくつかの問題がのパフォーマンスに影響を与えます
セグメンテーションアプローチ、一般的に発生する問題
、背景、閉塞、影、雨を移動する移動しています
カメラ、照明および視点変化。
A.監視ビデオシステム
トラフィック監視システムは、検出、および
交通ビデオから車(オブジェクト)を動かすの認識
シーケンス。すべてのトラフィック監視システム、車両
セグメンテーションは、追跡するための基本的なステップと塩基であります
車両の動き。トラフィックではなく、車のセグメンテーション
ビデオはまだによる移動物体に困難であると
照明変動。、教師なしにこの問題を解決するために、
ニューラルネットワークベースの背景モデル化はされています
リアルタイムのために提案されているが、セグメンテーションオブジェクト。この仕事で、
ニューラルネットワークは、両方の適応モデルとして役立ちます
ビデオシーケンス内の背景とピクセルの分類器として、
バックグラウンド/フォアグラウンド。で撮影したセグメンテーション時間
ニューラルネットワークは、FPGAキットでそれを実装することによって改善されています。
このニューラルネットワークベースの背景差分ものの
この方法は、それがうまく機能し、良いセグメンテーション精度を実現します
ほんのわずかに照明を変化させると移動下
バックグラウンド。高コストは時間を短縮することに関与しています
複雑[16]。これに続いて、[17]アッピアら。Alが提案されています
移動オブジェクトの統合されたハードウェア実装
様々な照明下でのリアルタイムビデオストリームにおけるセグメンテーション
条件。マルチモーダルな背景のための2個のアルゴリズム
モデリング及び連結成分分析が実施されます
シングルチップFPGA上。この方法セグメント下のオブジェクト
高い処理速度で照明条件を変化させます。ザ・
これまでに説明した2つのアルゴリズムがに問題が降って取ることはありません
アカウント。雨の状況、影と色の下で
反射が取り組むべき大きな問題です。A
従来のビデオオブジェクトセグメンテーションアルゴリズムいます
背景建設ベースのビデオオブジェクトを組み合わせました
セグメンテーションと前景抽出ベースのビデオ
オブジェクトセグメンテーションは、提案されています。フォアグラウンドであります
ヒストグラムベースの変更を使用してバックグラウンドから分離
検出技術とオブジェクト領域が分割されます
正確に基づいて初期移動物体マスクを検出することにより、
フレーム差分マスク上。影と色の反​​射
領域は、ダイヤモンドウィンドウマスクとカラーによって除去されます
それぞれのオブジェクトの移動の分析。のセグメンテーション
動いている物体は、形態学的操作によって洗練されています。ザ・
将来situations.In雨の下でオブジェクトを移動するのセグメンテーション結果は、我々は適応ます
しきい値とビデオのadjusttheコンテンツを取得
自動的に。以降、Chienら[19]ビデオオブジェクトを提案しました
スマートカメラのセグメンテーションおよびトラッキング技術
視覚的な監視ネットワーク。マルチ背景モデル
ビデオオブジェクトのための閾値判定アルゴリズムに基づいて、
照明の急激な変化の下でセグメンテーション及び
背景クラッタが開発されています。この方法では、
しきい値は、ユーザの要求とそれなしで確実に選択されています
回避画素あたりの背景モデルと異なっています
可能性のあるエラーの伝播。抽出するための別のアルゴリズム
静的なカメラで撮影した動画からのオブジェクトがされています
手を振ってツリーのような課題を解決するために提案、迷彩地域
そして睡眠はまた、[20]が提案されています。この方法は、基準に
バックグラウンドは、いくつかの初期フレームを平均することによって得られます。
オブジェクト抽出のための一時的な処理は考慮していません
フレームを横切る移動物体間の空間的相関。
したがって、おおよその動きフィールドが使用して導出されます
バックグラウンド減算及び時間差分機構。
背景モデルが揺れる(時間的変化を適応させます
相補の抽出水を波打つ木、等)
シーン内のオブジェクト。
使用した[18]は、図2に示されている 。 トラフィックの検出のために、最も重要なことは、オブジェクトは常に動きの原因であるので、しかし、車の多種多様を分類することですので、まだ識別することは困難です。したがって、この問題を解決するために、教師なしニューラルネットワークは、私たちは前景色と背景色とピクセル分類器に映像として使用する適応モデルです。ニューラルネットワークの計算時間の場合は、このニューラルネットワークは、メソッド「背景を選別」として高い分類結果を達成しているが、FGPA低減に彼をロードすることができるが、ほとんど小さな光と影と背景に移動することができません時間複雑さの高いコストを低減しつつ使用は、したがって、アッピアらは、統合されたアルゴリズムで実行可能なハードウェアを提供し、このアルゴリズムは、シングルコアFGPAの両方を実装することができ、それは十分です照明の問題を解決します。しかし、彼は、雨の中、影を雨の問題を解決し、光を主な質問です反映されません。伝統的なアルゴリズムは、バックグラウンドの分類に基づいて一緒に混合し、前景オブジェクトアーキテクチャを分離しました。前景「ヒストグラム」変化検出技術に基づいて使用されるべき、ターゲット領域もセグメント化されるべきである、第一の方法は、移動物体の検出である マスクと意味されるものでフレームマスク移動オブジェクト(の違いに基づいて現在はない )理解とにかく、彼は影や反射色の部分がダイヤモンドウィンドウマスクと色解析アルゴリズムが対処するために移動するターゲットしているだろうと述べました。このアルゴリズムは、幾何学的な点の形であり、移動物体は、このアルゴリズムを限定する必要がセグメント化され、結果がFIG2アウトに示されています。今後は、アルゴリズムが自動的に適応的に「しきい値」と調整でき、「コンテンツの調整を。」後、アルゴリズムはチェン小型カメラの視覚ニューラルネットワークのために提案され、この方法では、「しきい値」は、ユーザーが堅牢与える必要はありませんが、それはまた、画素によって異なるアルゴリズム画素であることができます可能なミスのプロパガンダを回避?(あなたは理解していない、何を意味しています)。もう一つの方法は、木を振っているキャプチャするために設計された、いくつかのものは変装であり、スチルカメラを使用することです。いくつかの使用平均初期フレームを初期化する(つまり??何を意味する)が、これは空間的相関、オブジェクトをジョギング特に人を考慮していませんか?
 
個人的にはそれはあなたが光と影の影響を除外することができるということです、アルゴリズムと組み合わせてレンダリングを行く、唯一の本当の目標を維持していました。
 
これらの最後の言葉は本当に理解していないので、私はGoogleの翻訳を指示しますか?
 
このように、誘導された近似スタジアムの使用
バックグラウンド減算及び時間差分機構。
背景モデルは、時間変化(スイングに適応する
補完的な抽出するために木、波打つ水など)
シーン内のオブジェクトを。
 
B.一般的なビデオシーケンス
与えられたジェネリックから前景オブジェクト抽出を移動します
ビデオショットは、コンテンツの表現のための重要な課題の一つであります
そして多くのコンピュータビジョンアプリケーションで検索。アン
エネルギー最小化に基づく反復法はされています
効率的に主要な移動物体をセグメント化するために提案
カメラのビデオシーケンスを移動するから。最初のオブジェクト
グラフカットを用いて得られたセグメンテーションを繰り返し向上させることが
隣接するフレームのセットに対して、抽出された特徴によって
[21]。従って、この反復方法は、効率的に区分することができ
移動カメラで撮影したビデオショット内のオブジェクト。A
条件付き確率場モデルベースのビデオオブジェクト
セグメンテーションシステムは、複数の動画を分割することができます
複雑な背景からオブジェクトが提案されている[22]。
この作品、ポイントや地域の補完的な性質
軌跡は、のラベルを転送することによって有効に利用されています
地域の軌道にまばらなポイント軌跡。領域
形状の一貫性に基づいた軌道は、堅牢な設計を提供します
セグメントに空間的にオーバーラップ領域の軌跡。地域として、
軌道は上の階層画像から抽出されますか?
セグメンテーション、そのセグメント経時的に意味のある領域。
時間と計算の複雑さ。監督されない
間を使ってカメラのビデオシーケンスを動かすのセグメンテーション?
フレームチェンジ検出が提案されている[23]。
ユニバーサル・ビデオ・シーケンス
リファレンスは、「反復アルゴリズム」の種類になされたものであり、彼はいくつかの画像で初期化され分裂の開始フレームので、このアルゴリズムは、抽出された隣接するフレーム内のいくつかの要素から「モバイルカメラ」から情報を抽出することができますか? 22に提出された論文ヶ月
ビデオオブジェクトの条件付き確率場モデルに基づく
セグメンテーションシステムを分けることができ、よりモバイルは、
複雑な背景からオブジェクト(??? Googleの翻訳を)提案されています
22主な論文は、スパースからの密なトラックに、アルゴリズムのトラックを言及しましたか?
23本の論文は教師なし学習法を述べましたか?
 
 
 
 
 
 
 

おすすめ

転載: www.cnblogs.com/coolwx/p/11462639.html