文学の読書ノート - 社会ウェイズ

引用

Amirian J、Hayet JB、Pettre J.社会方法:ガンス[J]との歩行軌跡の学習マルチモーダル分布。2019。

記事はさらにETH理想的なモニターでデータベースを見下ろす、強化するために、第2社会LSTM、社会GANモデルであり、UCY上のデータを予測。主な貢献は次のとおりです。

  1. これは、相互作用情報に注意フォーカスの独立した配分のモデルを作成するためのメカニズムを導入しました。
  2. 合理的な以上のものを追跡するためのモデルの予測能力を高めます。
  3. マルチトラックは、シーンのモデルの予測能力を検証することができ、小さな合成決意インデックス生成効果を追跡が提供されます。


モデルフレームワーク

上記のように、物品の基本的な枠組みは、各予測軌道に対して個別に、バッチでバッチを考慮せず、歩行者モデルGANネットワークです。

  • 発生器において、歩行者の予測をする(Iは\)\、最初の歩行者をコードする全ての公知の遺伝子座の、その後に基づくであろう\(Iは\)機構が注目モデルが導入されるように、歩行者や他の間の地理的及び動き情報他の歩行者へのインタラクティブな情報自律的適応。歩行者\(iは\)軌跡コーディング、注目のインタラクティブ情報プーリング、ノイズ、潜在コード(新コンテンツの導入、後述する)入力デコーダと、デコーダ歩行者などの4つの入力\(iは\)の予測軌道。
  • 弁別器では、トラックは/実際の軌道決意を生成し、それは、発電機/弁別コスト関数の結果として決定されます。
  • 具体的には、モデルのフレームワークがInfoGANれるソリューションネットワーキングはcGANと比べて、GaNと比べ発生潜コードを制御する上でGAN、その重点を制御するための傾向を変更することにより、潜在コードの監督なしに分散生成するために、InfoGANありますデータのカテゴリにできる教師なし(データなしラベル)学習の可能性を強調しています。このように新たに導入されたネットワークGAN 潜在コードと情報が損失二つの構造を。


ハイライト1 - 注意のメカニズム

モデルに基づく認知指標から適切なマニュアルインデックスを導入する、キーバリュークエリタイプ定義を使用して、注目機構は、異なる注目周囲の軌跡を生成します。

  • = =値キー\(H_t \) ターゲット・歩行者を除く\(私は\) その他の符号化情報トラック歩行者)。
  • クエリ:\(^ {} \のF IJ) 3つの動きの地理的移動から合成情報
    • \(I \)\(J \)間のユークリッド距離
    • \(Iは\)\(J \)運動の方向との間の角度。
    • 現在の競技のスタンス、\(私は\)\(jは\)将来の最短距離が出てきます。

\ [\シグマ(F {I} ^、F ^ K)= {{N-1} \ \上SQRT D _ {\シグマ}} <F ^ {I}、W_ \シグマH ^ K> \]

\ [\アルファ^ {I、J} = {EXP(\シグマ(F ^ {IJ}、H ^ J))\オーバー\ sum_ {k個の\ NEQ I} EXP(\シグマ(F ^ {IK}、H ^ K))} \]


ハイライト2 - InfoGAN

InfoGANモデルの解釈:https://www.jiqizhixin.com/articles/2018-10-29-21

モデル構造

モデル構造InfoGAN GANは小さいと比較して、上記モデルは、最初の入力における潜在コードの追加で改善した後SGAN損失関数L2、弁別器のほかに放棄しますサブネットワーク\(Q \)は、情報の損失を生産しました。

はじめに原則

  1. モチベーション: - \トレーニング後の理想的な状態はInfoGAN潜在コード(潜在コード)が調整される(C \)生成された入力の分布。しかし、柔軟性のGANの自由度の高い、ネットワークが直接潜在コードの存在を無視するのは簡単です、それはコスト関数を調整しなければならないネットワークの重要性潜在コードが可能に存在します。InfoGANは、相互情報量、所望の\(I \)を最適化対象として\(I \)電位コードとの関係を生成大きいです。

    \ [I(X; Y)= H(X) - H(X | Y)\]

    \ [I(C; G(Z、C))\]

  2. 制限:取得\(I(C; G( Z、C))\) 潜在コードに基づいてデータを生成するために必要な\を(X \ SIM G(Z 、C)\) 事後確率、それ故に得ることは非常に困難であり、および使用\(Q(C | X)\) 二次配布)の事後確率の近似解\(P(C | X)\) これまでのところ、研究を洗練するためのデータ2つの側面:\(Q(C | X-)\)にフィットする機能Cのジェネレータ感度

  3. ターゲット:相互情報の最大化に\(I(C; G( Z、C))\) 最大化することである\( - H(X- | Y)は\)が、そうすることによって、ため必要とされない\( - E_ {C \ SIM P(C )、X \ SIM G(Z、C)} [LOGQ(C | X)] \) を表し\( - H(X | Y )\) 下限相互情報変換の最大化下限相互情報量を最大化するには

    \ [E_ {C \ SIM P(C)、X \ SIM G(Z、C)} [LOGQ(C | X)] + H(C)\当量I(C; G(Z、C))\]

    その後は、実績のある、上記の式がに変換されて変換します。

    \ [L_1(G、Q)= E_ {X \ SIM G(Z、C)} [E_ {C '\ SIM P(C | X)}ログ(Q(C' | X))] + H(C )\]

    あなたが変換し続けたい理由はここに、私はかなり理解できない、その目的は何ですか?

    最終的にはGAN損失関数に入社した後、全体的な目的最適化の変更:

    \ [Min_Gmax_DV_1(D、G)= V(D、G) - ミューL_1(G、Q)\ \]

  4. 実装:実装における方法の社会モデルを、関数理論の消失はありません。機能にとても背が高く見えました。Qは、実際には完全に接続されたニューラルネットワークによって実現される潜在コード再構成(暗黙コード復元)、であり、識別器の訓練を受けました。情報の損失は、実際に指し潜在回復コードQ \(\ハットのC \)実際のコードと潜在\(C \)との間にMSEを


ハイライト3 - マルチ生成されたシーンは、軌道を予測しました

GAN軌道予測モデルは重要な目的は、トラック(分布)を複数生成を助けることである導入、物品は、(以下に示すように)特別人工テストシナリオを生成、GANマルチトラックの異なる種類のモデルの予測能力を探ることです。

  • 青、赤の軌道を予測することが知られて軌道です。
  • トレースは、6つの方向から発生し、ターンは、各方向に3つの特定の分岐トラックを生成します。

InfoGANに証明示すように、異なる反復によって生成された異なるベースラインモデル予測の結果、複数の軌道予測妥当反復の短い期間で様々な可能性の軌跡を認識することができる効果、。

また、記事でも評価されている品質、実際の将来の軌道と軌道を生成する方法は2つあり、1最近傍分類器と地球ムーバーの距離を使用しました。

  • 1-最近傍分類器の場合、約50%向上。
  • EMDのために、よりよい下。

おすすめ

転載: www.cnblogs.com/sinoyou/p/11512830.html