Openposeの姿勢推定


ポーズ推定位置は非常に著名な傑作です。Openpose

  1. 抽象
    フォーカスあなたの論文、あなたはそれが抽象的であるに見る必要があり、この論文では主にプレゼントPAF法と組合せ数学の背後にある(現在推定3Dの姿勢)2Dマルチ姿勢推定のシングル絵、 K 2部グラフマッチング法、接続中のCPMより乾燥手足の問題に非常にエレガントな解決策。高い精度を維持しつつ、提案ネットワーク構造は、第一、リアルタイム要件に達すると、フルマップエンコードを行います。本明細書で使用する場合、多分岐の分岐ジョイントは、分岐は検出を担当して、キーポイントは、キーフレームに接続され、その後ハンガリーアルゴリズム二部グラフマッチングにより、例えばAはボトムアップの構造。2016年のココキーポイントで最初のゲームを作って、そのようなデータMPIIで創太に達した上でフォーカス(も創太にブラシをフォローアップがhrnetであるだけでなく、最近のモコをkaiming教師なしの方法、私たちは追いつくことができません。)

  2. はじめ
    の記事では、プレゼントには、以下の課題が姿勢推定。
    (1)画像内の位置の数、それらは任意の位置、およびサイズで表示されてもよいです。
    番号と一緒に数を増やしながら、お互いに接触している(2)。原因、および閉塞悪い状況が、キーポイントに検出するのは難しいだろう、時間を実行しているの複雑さは、挑戦のリアルタイム表示を行う、上昇します。この方法は、主に+シンゲル人eatimationを検出するのに使用されています。しかし、この方法では検出が冷えている場合は、バックキーポイントもShayaを見つけ、検出の精度に大きく依存します。
    (3)は、テストが非常にディアオですが、30人がいる場合は、複雑なシーンでは、この方法は非常に遅くなります30単体の姿勢推定を、繰り返す必要があります。

  3. 方法
    ボトムアップ人体姿勢推定にPAF(パートアフィニティFieilds)(クイック翻訳?コンポーネントの親和性フィールドを?)を使用して、本論文では、ボトムアップ方式のための主なもの、。CPMの方法は、各人間の体が臨界点を持って見ることができるように、第1の本体の右の肩の上に、このような画像の位置など、人のキーポイントの位置を検出することを学ぶ、テスト結果は、体のヒートマップのキーポイントを予測することによって得られますガウスピークは、体が重要なポイントであると予測ネットワーク、他の同じ臨界点の皆のための同じ結果を表す、検出結果は、検出結果を得た後、臨界点に加えて、接続の測定結果を得ました。接続を行う場合、主な用途は、PAF(フォローアップが記載され、数学の問題の束)です。
    次のように処理がされるように:

    まず、入力画像、図、ネットワークを介して、Bは中央左軸に示されるように、異なる臨界点で同一人物を参照すると、各ヒートマップの事実をヒートマップパイル得られますポイント、及び左肩の位置、及び図PAF cのようなセットは、二部グラフを照合することによってD、得られた結果はemmm、Eは解決されます。完璧。

  4. 同時検出および協会
    次の図のような主要なネットワーク。

    前記PAFs画素を用いて、骨格に記載するために使用される\(L(P)\)対応するキーポイントと、表すこと\(S(P)\)表されます。ネットワーク層10は、第VGG-19によって初期化され、骨格はpretrainモデルを通過した後、トリミング前に、それぞれの回帰に、2つの分岐が存在することになる(L(P \)\\(S(P)\)各ステージは、損失のトレーニングはL2ノルムGT .S Lで使用され、そして基づいたトレーニングの次のステージに供給次いで、損失とみなされ、LおよびS Fは、元の入力CONCATENATEあるれた後ラベルが存在しない場合、ラベルはポイントではありません。連続微調整のためにネットワークを介しての方法は、二つのブランチダウンのネットワーク環境を示し、各ブランチがt段階でキーポイント、臨界点をマークし、マップを特色にする、各段階は、融合される(\ \ロー\ varphi \)ネットワークを表す

    図が粗い出力であるが。
    主L2の損失があります。
    \ [\開始{アレイ} {1} {F _ {\ mathrm {S}} ^ {T} = \ sum_ {J = 1} ^ {J} \和が_ {\ mathrm {P}} \ mathrm {W}( \ mathrm {P})\ CDOT \左\ | \ mathrm {S} _ {J} ^ {T}(\ mathrm {P}) - \ mathrm {S} _ {J} ^ {\ CDOT}(\ mathrm {P})\右\ | _ {2} ^ {2}} \\ {fは_ {\ mathrm {L}} ^ {T} = \ sum_ {i = 1} ^ {C} \和_ {\ mathrm { P}} \ mathrm {W}(\ mathrm {P})\ CDOT \ \左| \ mathrm {L} _ {C} ^ {T}(\ mathrm {P}) - \ mathrm {L} _ {C } ^ {*}(\ mathrm {P})\ \右| _ {2 ^ {+}} ^ {2}} \端{アレイ} \クワッドF = \ sum_ {T = 1} ^ {T} \左(F _ {\ mathrm {S}} ^ {T} + F _ {\ mathrm {L}} ^ {T} \右)\]

  5. 信頼その検出のためのマップ
    検出手段についてなど。

    、次に指定された注釈データ算出GT \(\ mathbf {S *} ^ {} \)各信頼度マップは、理想的には、2次元表示である場合、場合画像の値が人物が含まれている場合、キーが表示されている場合、それに対応する信頼性マップは、ピークに表示され、画像は、個々の鍵Kのすべての目に見える点について複数人である場合、jは、対応します信頼性マップは、ピークがあるでしょう。上記のように、各個体は最初の信頼は、個々のkをマッピング与えられ、\(X_ {J、K} \で\ R&LT mathbb {2}} ^ {\) GT jを対応するヒトkに対応する画像の位置を表します位置。\(\ mathbf {S} _ {J、K} ^ {*}(\ mathbf {P})= \ EXP \左( - \ FRAC {\左\ | \ mathbf {P} - \ mathbf {X} _ {J、K} \右\ | _ {2} ^ {2}} {\シグマ^ {2}} \右)\) ここで、\(\シグマ\)信頼度マップの範囲内にピークの広がりを制御するために使用されます、図信頼度は、以下のように複数の人物に対応するマップ。ここでは、マップが特徴マップ内の同じ最大値で保存され、より正確なピーク自信になります。上記のように位置に対応する予測値を計算ネットワーク内のGTが位置Pであり、最大値とる\(\ mathbf {S} _ {J} ^ {*}(\ mathbf {P})= \最大_ {K}を\ mathbf {S} _ {J} * {K} ^(\ mathbf {P})\)ネットワークの予測段階では、NMSによる最終的信頼を得ることができます。
  6. パート協会パート親和フィールドが

    キーポイントの数を発見した後、我々はそれを接続する方法、これは非常に難しい問題です。人々は、姿勢推定場合は特に、キーポイント上の画像の間に存在する関係が存在し得る多くの可能性です。この論文では、四肢の領域の方向との関係との位置関係を維持しながら、親和性部材PAFsフィールドは、各肢は、接続の種類があります
    、その2つの関連するフィールドの親和性の対応する部分の接触を。
    :例えば、グラフ用紙に

    画像\(\ mathbf {X} _ {J_ {1}}、K \) と\(\ mathbf {X} _ {J_ {2}}、K \) 最初を表しますGT J1及び位置のJ2、四肢上の点P cが低下すると、2つの本体部分の個々の手足・K C \(\ mathbf {L} _ ({C、K} ^ {*}を\ mathbf {P })\)四肢上の点Pを指し示す値J1、J2の単位ベクトルは0ではない
    トレーニングプロセスを評価するために、\({L} F_ \)を、PAF GT値は、点pで定義されている\( \ mathbf {L} _ {C 、Kは} ^ {*}(\ mathbf {P})= \ \ {} {} {LLのアレイを開始\左{\ mathbf {V}}&上にpなら{\テキスト{ } \ OperatorName肢{C}、{K} 0}&{\\ \}そうでなければ{テキスト} \}終了{アレイ\右の\) 前記\(\ mathbf {L} _ {C、K} ^ {*}(\ mathbf {P})= \ {} {} {LLのアレイを開始\ \左{\ mathbf {V}}&{\テキスト{もし} \ operatorname {四肢}上にp C、K} \\ {0}&{\テキスト{さもなければ}} \端{アレイ} \右。\) 単位ベクトル肢を表します。
    \(0 \当量\ mathbf { V} \ CDOT \左(\ mathbf {P} - \ mathbf {X} _ {J_ {1}、K} \右)\当量L_ {C、K} \テキスト{ そして} \左| \ mathbf { V} _ {\ PERP} \ CDOT \左(\ mathbf {P} - \ mathbf {X} _ {J_ {1}、K} \右)\右| \当量\ sigma_ {1} \)の範囲内の点Pは、四肢C、上に定義されている\(\ sigma_ {1} \ ) 肢の幅の代表、\ mathbf {X | \(メントキシ{C、K} = \左\ } _ {J_ {2}、 K} - \ mathbf {X} _ {J_ {1}、K} \右\ | _ {2} \) 四肢の長さを表します。
    全てPAFのこの時点でフィールド部材と親和GT平均値の点p、\(\ mathbf {L} _ {C} ^ {*}(\ mathbf {P})= \ FRAC。1 {{} N_ {C}(\ mathbf {P})} \ sum_ {K} \ mathbf {L} _ {C、K} ^ {*}(\ mathbf {P})\)の\(N_ {C} { (p)は} \)の非ゼロベクトルの数を表します。
    予測ステージ、会員ポイントのための2つの候補で\(D_ {J1} \)\(J2 D_ {} \) 我々は線PAFに沿った予測されるサンプルを得る(L_ {C} \)\、へ信頼の2つの部分の間の相関を測定し、\(E = \ INT_ {U = U = {0} 1} ^ \ mathbf {L} _ {C}(\ mathbf {P}(U))\ CDOT \ FRAC {\ mathrm {D} _ {J_ {2}} - \ mathbf {D} _ {J_ {1}}} {\ \左| \ mathbf {D} _ {J_ {2}} - \ mathbf {D {{_ J_ 1}。}} \右\ | _ {2}}デュ\) \(P {(U)} \) 2つの本体部分との間の位置を表す:\(\ mathbf {P}( U)=(1-U)\ mathbf {D} {_ J_。1}} + {U \ mathbf J_ {D} _ {{2}} \) リアルタイム予測U等間隔サンプリング間隔を加算おおよその整数値を解きます。
  7. PAFsの用いたマルチパーソン解析
    :PAFデコード解像度の人々が働いている

    次のステップはPAFsデコードの最終結果であり、我々の予測の信頼図NMS操作の後、あなたはそれぞれのために、個別の候補ボディパーツのセットを取得することができますこれは、結合本体部材からはるかに有望な候補のための個々の複数の画像は、上記式を積分することによって定義することができる場合、各肢のスコアを得られた候補から、候補が複数存在することを意味します。
    本明細書で、貪欲な緩和は、高品質の一致を製造する方法を提案した:
    (1)まず、予測候補信頼度マップの個別部品\(\ mathcal {D} _ {\ mathcal {J}} = \左\ {\ mathbf {D} _ { J} ^ {M}内J \ \ {1 \ ldots J \}、M \ \には\左{1 \ ldots N_ {J} \右\} \右\} \ 、ここで\(D_ {J} ^ { M}は\) m番目の位置の候補キーポイントの本体部材jを表し、\ N_の({J}は\)候補点jの数を表します。
    (2)。私たちの目標は、最初の変数を定義し、他の候補の候補領域と均一な個々の構成要素の要件が接続されて一致するZ_ {J_ {1}(\ {0,1 \におけるJ_ {2}} ^ {MN} \ \ } \) 2人の候補メンバーを示すために使用される\(\ mathbf {D} _ {{J_。1} ^ {M}}を\)\(\ mathbf {D} _ {P}} ^ {N- \)の間接続があります。候補セットのメンバーへのすべての接続
    \(\ mathcal {Z}は= 、テキスト{ため\} J_ {1}、J_ {2} \ \ {1 \ ldots J \}:\ {Z_ {jはJ_ {2}} ^ {MN} \左){N_ {J_ {1}} \右\の1 \ ldotsを} \左、N- \ \で\左{N_ {J_ {2}} \右\ 1 \ ldots} \右\}を\ \におけるM \
    ( 3)。別四肢考える\(C \)に対応する2つの本体部分\(J_ {1} \)\(J_ {2} \) 及び目標は、定義された、最高総親和性マップマッチングモードの値を見つけることです総アフィニティ値:\(\最大_ {\ mathcal Z {}} E_ {C}の_ {C} = \最大_ {\ mathcal Z {}}} _ {C \ sum_ {M \で\ mathcal { D} _ {N}} \ sum_ {N- \で\ mathcal {D} _ {J_ {2}}}のE_ {Mnは} \ CDOT Z _ {\テキスト{ジル}} ^ {Mnは} \)、ここで (\ \ FORALL M \で\ mathcal { D} _ {J_ {1}}、\ sum_ {N \で\ mathcal {D} _ {J_ {2}}} Z_ {J_ {1} J_ {2}} ^ { MN} \ 1当量1 \)
    \(\ FORALL N- \で\ mathcal {D} _ {J_ {2}}、\ sum_ {M \で\ mathcal {D} _ {J_ {1}}} Z_ {J_ { {2}} J_。1}} ^ {Mnが\ 1当量1 \)\ E_ {} \の(Mn)が表す\(D_ {J1} ^ { M} \) と\(D_ {J2} ^ { N} \) の間の親和性。注:2本の手足がない共通点の同じタイプ。
    (4)場合Kは、とすることができる2部グラフマッチング問題であることを考慮するとより身体姿勢推定(\最大_ {\ mathcal \ {Z}} E = \ sum_ {T = 1} ^ {T } \マックス} _ {E_ {C} {\)のC} Z_、一対の独立して最適化され、そして身体の上体姿勢に組み込ま同じコネクタ本体部を有しているヒトの四肢

おすすめ

転載: www.cnblogs.com/zonechen/p/11900481.html