確率的グラフィカルモデル(PGM)

あちこちからの抜粋は、自分の研究ノートは、Wuguaiは、侵略を削除する場合にのみ!

ネットワークへのベイジアン確率的グラフィカルモデル(ベイジアンネットワーク)とマルコフランダムフィールド(マルコフネットワーク)は、2つのカテゴリ。ベイジアンネットワークは有向グラフ構造であってもよい、マルコフランダムフィールドは、ネットワーク構造なし有向グラフとして表すことができます。
より詳細には、確率的グラフィカルモデルは、ナイーブベイズモデル、最大エントロピー、隠れマルコフモデル、症例報告書、テーマモデルを含み、機械学習の多くのシーンは、用途の広い範囲を持っています。
確率的グラフィカルモデル

(産業を含む)実際に使用される確率的グラフィカルモデルは、非常に広範かつ成功しています。ここではいくつかの例があります。隠れマルコフモデル(HMM)の音声認識モデルが柱である、ガウス混合モデル(GMM)及び変異体は、そのデータの最も基本的なモデルK平均クラスタリングであり、条件付確率場(CRF)が広く自然言語処理に使用される(例えばスピーチタグ付け、固有表現認識)は、イジングモデルは、というように産業部門でノーベル賞は、そのようなTencentの推薦システムとして話題モデルを頻繁に使用し()受賞しました
 
コアタスクは、暗黙知は、このタスクを達成するために、確率的グラフィカルモデルは非常にエレガントで、原理的な手段であり、観測データから機械学習を掘っています。PGMは、巧みにグラフ理論と確率論を兼ね備えています。
  グラフ理論の観点から、PGMは、ノードとエッジを有するグラフです。暗黙ノードと観測ノード:ノードは、2つのカテゴリに分けることができます。サイドは有向グラフまたは無向することができます。
  確率論の観点からは、PGMが確率分布であり、ノードは確率変数の依存関係又は相関のエッジに対応する、ランダム変数を図に相当します。
  本当の問題を考えると、我々は通常、データ、知識のいくつかを観察し、データに隠された掘ることができるように願っています。PGMとそれを達成するためにどのように?我々は、知識とデータとの関係を説明するためのそれぞれの側で、隠されたノードとの潜在的な知識を表す観測ノードと観測されたデータを示す図を作成し、最後に確率分布を取得します。所定の確率分布後、二つのタスク実行することによって:推論と知識を獲得する、(確率分布のパラメータを学習)学習(所与の観測ノードは、隠されたノードが分布後方推測します)。PGMのパワーは、その関係なく、当社のデータ処理手段はどのように複雑なデータや知識、同じではありません:行っ推論と学習、マップを構築する確率分布を定義します。大規模な人工知能システムを構築するための複雑な現実的な問題のこの記述は、それは非常に重要です。
 

図確率モデル式によるデータ(サンプル)  [公式] モデリング表されます:

  • [公式] すなわち、ランダム変数と、特に、(ここでは、トークンまたはラベルであってもよい)、ノードを示す  [公式] ノートは、確率変数モデリング  [公式] 今仮想配列に対応する(確率変数の数を表し、それは多くが含まれていトークン)、  [公式] 確率変数の分布。
  • [公式] エッジ、つまり、依存性の確率を表します。具体的にがたは理解以降CRFグラフHMM又は特異的な結合に解釈されます。

有向非有向グラフ:確率的グラフィカルモデルは、2つのタイプに分けることができます。

そこ無向グラフ有向グラフ対

図を見ることができる、ベイジアンネットワーク(信念ネットワーク)が導かれ、マルコフネットワークを無向れます。そのため、相互に依存するモデルのエンティティ間の依存一方向のデータ、マルコフネットワークをモデル化するためのベイジアンネットワークがあります。具体的には、検索する方法で自社のコアの違いの性能は  [公式] 、それがどのように表し  [公式] 同時確率を。

 有向グラフ

有向グラフモデルのため、そう同時確率を求めます。 [公式]

たとえば、グラフにする必要があり、以下の確率変数のために(私が描いたこの数字はかなり広範であることに注意してください):

これは彼らの同時確率を表している必要があります:

[公式]

これはよく理解されなければなりません。

無向グラフ

無向グラフの場合、私は(私が描いたこの数字は、比較的広いことに注意してください)、それは情報マルコフネットワークを指し、一般的には思います。

グラフが大きすぎる場合、それは倍に分解することができる  [公式] 関節確率の数に書き込まれる製品。それを分解イエは、図の複数に分割されている。「小グループ」を、各グループは、特定の任意の2点に取り付けられている「最大基」(でなければならないことに注意......まあ何の説明は、最大接続サブされず図)、があります。

 

         [公式]

 

どの  [公式] 式がそれを理解することは難しいことではありません、確率を数えた結果の正規化を可能にすることです。

したがって、上記の無向グラフのように:

[公式]

どちら  [公式] の最大のグループの一つである  [公式] 同時確率ランダム変数であり、そして一般的に指数関数:

[公式]

さて、この事は、チューブと呼ばれます势函数ことに注意してください  [公式] CRFの影を見ることがある場合。

同時確率分布は図分解で表すことができる可能性があります。

[公式]

CRFの始まりである黒板、ノック、ここでの理解は、再帰的プロセスを注意することが非常に重要であることに注意してください!

 

おすすめ

転載: www.cnblogs.com/daguonice/p/11418529.html