すべてのメモの概要:「ディープラーニング」フラワーブック-読書メモの概要
「ディープラーニング」PDF無料ダウンロード:「ディープラーニング」
1.確率
これは、イベントの発生頻度に直接関係し、頻度確率と呼ばれます。
確実性のレベルに関しては、ベイズ確率と呼ばれます。
第二に、確率変数
確率変数は、離散変数または連続変数にすることができます。
3、確率分布
これは、考えられる各状態での確率変数または確率変数のクラスターの確率を説明するために使用されます。確率分布を記述する方法は、確率変数が離散であるか連続であるかによって異なります。
離散変数の確率分布は、確率質量関数で記述できます。調査の対象が連続確率変数である場合、確率密度関数を使用してその確率分布を記述します。
第四に、周辺確率
変数のセットの同時確率分布はわかっていますが、それらのサブセットの確率分布を知りたいと思います。このような確率は、分布のサブセットで定義され、周辺確率分布(周辺確率分布)と呼ばれます。
5.条件付き確率
多くの場合、特定のイベントに関心があります。他のイベントが発生する確率を考えると、この確率は条件付き確率と呼ばれます。
6.条件付き確率の連鎖律
P(a、b、c)= P(a∣b、c)P(b、c)= P(a∣b、c)P(b∣c)P(c)P(a、b、c) = P(a | b、c)P(b、c)= P(a | b、c)P(b | c)P(c) P (a 、b 、c )=P (| B 、c )P (b 、c )=P (| B 、C )P (B | C )P (C )
セブン、独立性と条件付き独立性
2つの確率変数xxx和yyy、確率分布が2つの因子の積として表現でき、1つの因子にxxのみが含まれている場合xの他の因数にはyyのみが含まれますy、これら2つの確率変数を互いに独立して呼びます。
x⊥yx\ bot yX ⊥ yの
程度であればXXx和yyyの条件付き確率分布はzz用ですzの各値は積として記述でき、次にこれら2つの確率変数xxx和yy与えられた確率変数zzのyzは条件付き独立です。x⊥y∣zx \ bot y | zX ⊥ Y | Z
8.期待値、分散、共分散
ある意味での共分散(共分散)は、2つの変数間の線形相関の強さとこれらの変数のスケールを示します。Cov(f(x)、g(y))= E [(f(x)− E [f( x)])(g(y)− E [g(y)])] Cov(f(x)、g(y))= E [(f(x)-E [f(x)])(g (y)-E [g(y)])]C o v (f (x )、g (y ))=E [ (f (x )−E [ f (x )] )(g (y )−E [ g (y )] )]
9つの一般的に使用される確率分布
- ベルヌーイ分布
- Multinoulli分布(multinoulli分布)またはカテゴリ別分布
- 正規分布またはガウス分布
- 指数分布
- ラプラス分布(ラプラス分布)
- ディラック分布または経験分布
- 混合分布(GMMガウス混合モデル)
10.一般的に使用される関数の便利なプロパティ
ロジスティックシグモイド関数:σ(x)= 1 1 +exp(− x)\ sigma(x)= \ frac1 {1+ \ exp(-x)}σ (x )=1+exp (− x )1
softplus関数:ζ(x)=log(1 +exp(x))\ zeta(x)= \ log(1+ \ exp(x))ζ (x )=lo g(1+exp (x ))
いくつかの一般的なプロパティ:
11、ベイズの定理
P(x ∣ y)= P(x)P(y ∣ x)P(y)P(x | y)= \ frac {P(x)P(y | x)} {P(y)} P (x ∣ y )=P (y )P (X )P (Y | X )
12.連続変数の技術的詳細
13.情報理論
主な研究は、信号に含まれる情報の量を定量化することです。
カルバックライブラー(KL)発散を使用して、2つの分布の差を測定します。DKL(P∣∣Q)= E x〜P [logP(x)Q(x)] = E x〜P [logP (x)−logQ(x)] D_ {KL}(P || Q)= E_ {x \ sim P} \ Big [\ log \ frac {P(x)} {Q(x)} \ Big ] = E_ {x \ sim P} \ Big [\ log {P(x)}-\ log {Q(x)} \ Big]DK L(P | | Q )=EX 〜P[lo gQ (x )P (X )]=EX 〜P[lo gP (x )−lo gQ (x )]
KL発散には多くの有用な特性がありますが、その中で最も重要なのは、それが非負であるということです。PPの場合に限り、KL発散は0です。PとQQQは、離散変数の場合は同じ分布であり、連続変数の場合は「ほとんどどこでも」同じです。
14.構造化確率モデル
構造化確率モデルには、有向と無向の2つの主要なタイプがあります。有向または無向は、確率分布の特性ではありません。これは、確率分布の特別な記述の特性であり、任意の確率分布は、これら2つの方法で記述できます。
次の章のポータル:Huashuリーディングノート(3)-数値計算