「深層学習に基づく視点間歩行認識アルゴリズムの研究」を読む

2020年

背景:

新たな認識技術として、歩容認識は、制御されていない長距離、低解像度のシーンでも識別を実行できるという利点があり、歩容の変化や偽装が容易ではないため、近年注目が高まっています。

新しい識別技術として、歩行認識は歩行姿勢に応じて個人を識別できます。顔や指紋などの近距離での収集が必要で人の協力が必要な既存の生物学的特徴と比較して、歩行は解像度が低く、環境の影響が少なく、収集が容易であるという利点を持っています。また、本人が意識することなく歩行者の歩容を収集して認識することができ、歩行者の歩行姿勢の偽装や模倣が困難である。歩行認識のこうした利点により、最近研究者の注目が高まっています。現在、デンマークやイギリスなどの国や地域では、刑事事件において捜査官が歩容認識システムを用いて不審者の歩行姿勢を解析し、捜査の効率と精度を向上させ、事件の軽減に役立てるという歩行分析が導入されています。顔認識や歩行者の再識別などのテクノロジーの失敗や手動スクリーニングの非効率性により、容疑者が逃走する可能性が生じます。
しかし、日常生活では、監視システムでキャプチャされた歩行サンプルと登録された歩行サンプルの間に視点の違いが存在することが多く、これにより従来の歩行認識アルゴリズムの有効性が大幅に低下します。したがって、クロスビュー歩行認識の問題を解決し、歩行認識の精度とリアルタイム性能を向上させることは、歩行認識製品が克服しなければならない技術的課題です。
現在の困難 交差
角度歩行認識における現在の困難は、異なる視野角での歩行者の歩行の視覚的な違いが大きいことにあります。歩行特徴量には歩行者の体形と歩行姿勢情報のみが含まれており、色や質感の特徴は含まれていないため、異なるビューの歩行から歩行者のアイデンティティを表すビュー不変特徴量を抽出することは困難です。角度を越える際の歩行認識の認識率が低い問題を解決するために

現在の回避策

1 つ目のカテゴリは、パノラマ カメラや複数のキャリブレーション済みカメラによる 3D 歩行情報から構築される交差角度認識手法ですが、
これらの手法には複雑な制御可能なカメラ設定が必要であり、実際のアプリケーションでの実装は困難です。一方で、これらの手法は計算負荷が大きいため、実用化の可能性はさらに限定されます。
2 番目のカテゴリは、ビュー変換モデル VTM に基づくクロスビュー認識方法です。このアプローチでは、他の視点からの情報を活用し、特異値分解や回帰などの手法を使用して歩行特徴を集中的に構築します。
VTM 法は、変換された視野角の歩行特徴と元の特徴との差異を低減するだけであり、個人間の識別要素が考慮されていないため、このタイプの方法はモデリング計算中にノイズ伝播が発生しやすく、結果として歩行速度が低下します。認識率は良好です。
3 番目のカテゴリは、ビュー不変性を備えた歩行特徴を抽出することです。
歩行データにはクロスビュー歩行ラベルがないため、モデルのトレーニングを完了することが難しく、一般的に使用される損失関数は暗記による顔認識タスクで広く使用されています。

視野角の変化に影響されない特徴を抽出することで、実際のシーンでの歩行認識技術の有効性に対する視野角の変化の影響を軽減し、歩行者がどの角度でカメラを通過してもターゲットの身元を正確に識別するという目的を達成できます。歩行認識技術の堅牢性と実用化価値を大幅に向上させ、歩行認識技術の産業化と標準化を促進し、実生活で役割を果たす完全な製品またはサービスを形成します

現在の困難の性質

同じ人物をさまざまな角度から撮影すると歩行プロファイルは異なり、撮影角度の違いが大きいほど、同じ歩行者の違いが大きくなります。人間の場合、この問題は、複雑な計算推論と脳内での 3 次元変換によって、異なる視点からのこれらの歩行が同一人物によるものであるかどうかを判断できることがよくあります。しかし、コンピュータの場合、その入力は離散的なピクセル点で構成される 2 次元のデジタル画像のみであり、これらのピクセルによる視野角の不変性の問題を解決することは非常に困難です。一方、歩行特徴量には歩行者の衣服の色や質感の特徴は含まれず、歩行者の輪郭や歩行姿勢の特徴のみが含まれるため、色や質感から視野角の変換関係を推測することはできません。間違いなく、交差視野角が増加し、認識が困難になります。歩行特徴の場合、視点情報、アイデンティティ情報、さまざまな衣服、バックパック、および輪郭分割エラーによって生成されるノイズ干渉情報の 3 種類の情報のみが含まれていると考えることができます。したがって、歩行特徴における視点情報と同一性情報を分離し、同一性情報を含む特徴のみを識別に使用できれば、視点横断的な歩行認識の精度が大幅に向上し、視点干渉に対する耐性が向上します。改善されること。
クエリサンプルが与えられた場合、クロスビュー歩行認識の目的は、クエリサンプルとは異なる特定のビューの登録データセットから、クエリサンプルと同じ同一性を持つ登録サンプルを正確に見つけることです。
ここに画像の説明を挿入

このうち、Gは生成された歩行エネルギーマップにおける位置(i,j)の画素値を表し、sは歩行系列・モーメントにおける歩行シルエットマップの位置(i,j)の画素値を表し、Tは歩行シーケンスの長さを表します。実際のアプリケーションでは、歩行エネルギーマップを計算する前に、各瞬間の歩行シルエットマップの重心の位置が一致するように、歩行を補正して位置合わせする必要があります。

(将仅有的两个特征视角和身份拆开分析)

本章では、同一性特徴と視点特徴を分離し、歩行特徴における視点情報と同一性情報を分離し、識別情報のみを含む特徴のみを識別に使用することで、視点横断歩行認識の精度を向上させる視点横断歩行認識アルゴリズムを提案する。角度干渉防止能力が向上します。抽出されたアイデンティティ特徴とビュー特徴がすべて歩行サンプルからの情報であることを保証するために、この章ではオートエンコーダを使用して元の入力歩行サンプルを復元し、ビューエンコーダ、アイデンティティエンコーダ、および歩行デコードデバイスを設計します。
(将仅有的两个特征视角和身份一起分析)
歩行認識タスクでは、同一性識別能力とビュー不変性の両方を備えた特徴をどのように抽出するかが、歩行認識の精度を向上させる鍵となります。実生活では、人々は歩行時に歩行者の体の動きの特徴や体型の特徴の一部に注意を払うだけで歩行者を特定できることがよくあります。これは、歩行者の体のさまざまな部分の重みが歩行者の表現に反映されることを意味します。歩行特性は同じではないため、歩行者の身体を分割する必要があります。具体的な特徴表現としては、水平ピラミッドは水平方向のマルチスケール特徴抽出手法であり、人物再識別のタスクにおいて優れた性能を発揮することが実証されている。

展望:

純化同一性特徴の損失により認識率が向上する可能性がありますが、これは、損失の組み合わせが識別表現を強化するのに有益であることを示しているだけですが、特徴に干渉が存在する可能性があります。解決策: 特徴の分布と視覚化を研究します。データ セットの視点が少なく、隣接する視点の範囲が非常に小さいため、(TSNE?)GAN 分解歩行サンプルがデータ セットに及ぼす影響は、以前のものを大幅に上回ることはありません。
これは、視野角の差が小さい場合、この方法が歩行サンプルのアイデンティティと視野角特徴の分離に明らかな影響を及ぼさないことを示しているため、将来的にはより洗練されたネットワークを設計してこの問題を解決できます。バックパックやさまざまな衣服などの状況でのパフォーマンスの課題
将来的には、特徴選択による解決を試みることができ、バックパックや衣服を表現する干渉情報については、特徴選択を使用してフィルタリングすることで、より良い認識結果が得られる可能性があります。(行人重识别还好说,有颜色啥的分割,这全是白块怎么知道哪是背包,哪是穿着)

おすすめ

転載: blog.csdn.net/weixin_40459958/article/details/128079851