自然言語処理の確率の基礎


  確率は確率で自然言語処理を学習することは一般的に使用される数学的知識の一つであり、学習を開始するには、高校からのコンテンツですが、長年卒業し、毎日の仕事や勉強でもほとんど使われない、半分を忘れて、我々はベースに機会を得ました知識の復習。
確率:確率は何ですか?理解するためのシンプルな、イベントのイベント、または発生した事象の可能性が一連のイベントの一連の周波数。
結合確率: P(AB)、同時確率でAとBの両方の発生の可能性の代わりに。
条件付き確率:特定のイベントの発生確率、他のイベントが発生しました。イベントBはまた、P(A | B)のように書かれたときに発生したイベントAの我々条件付き確率で発生します。集合A、Bの2つのイベントで、イベントAは不可能ではないが、それはイベントAに呼び出され、イベントBの条件付き確率が発生します。

例:男の子は私も確率を気に入っている間、私は、フロントデスクミリメートルミリメートルのインターンを尋ねるように知られているフォアグラウンドミリメートルミリメートルとインターンは、各グループに男の検索愛情を持って、10人のグループが検索されていると仮定しますか?
P(A)= 1/500、P(B)= 1/500、P(AB)= 1/500 1/500 *。。。。
P(B | A)= P(A-B)/ P(A)= 1/500。

依存性事象と独立したイベント:イベントの確率はどのような方法で他のイベントに影響を与えていない場合、イベントは孤立した事件と呼ばれ、それ以外の場合は、依存するイベントです。P(A | B)= P (A)。イベントAは、イベントBの独立していることを、この手段

 

ベイズ確率論(ベイズの定理)
  ベイズ確率の理解の代替として使用することができます。ベイズの定理は、定理のランダムイベントA及びB(又は周辺確率)の条件付き確率です。


例:
1月の要求Pの後に雨曇りの確率は(雨/女性)が
知られている:6日、約5日曇りP(メス)= 1/6、約一ヶ月の日数は、Pを雨(雨その後、)= 1/5、日P(女性/雨以前のように雨の女性確率)= 4/5、:P(雨/女性)= P(女性/雨)* P)(雨)/ P(メス= 1/5 * 4/5/1/6 = 24/25 = 96%

 

連続および離散確率分布の
  ようなコインとベルヌーイ分布を投げるの場合と有限の値を、処理するため有する離散ランダム変数分布:確率分布は二つのタイプに分けることができます。これは、連続分布(理論的に)値を持つ確率変数の無数のための連続プロセスによって定義される、いわゆる離散分布の確率質量関数(PMF)です。速度と加速度を用いて測定された音響センサを考えます。連続分布は、確率密度関数(PDF)の定義です。
離散分布の和Σを使用している間、積分∫を使用して、通常は連続分布:これらの2つのタイプは、数学的な治療の分布が異なります。一例として、期待に:



  離散等ランダムベルヌーイ分布(ベルヌーイ分布)を有する可変共通の二項分布(二項分布)、ポアソン分布(ポアソン分布)、および一般的な分布は、連続確率変数を含む均一に分布(一様分布)指数分布(指数分布)、正規分布。

 

1、ベルヌーイ分布

  ポイントベルヌーイ分布の最も単純で開始。
ベルヌーイ分布は、2つだけの可能な結果、1(成功)と0(失敗)です。したがって、Xの分布値を有するベルヌーイ・ランダム変数、すなわち、成功の確率が、1であってもよく、pで表すことができ、値は1-Pと、即ち故障の確率、0であってもよく、またはqが表されています。
PX(1-P)1:確率質量関数は次式で与えられ 、-X、 X€(0、1)。それはまたのように書くことができます。


そのようなXの期待値と分散ベルヌーイ・ランダム変数である:
(1-P)E(X)= P * 1 + 0 * = P

分散を持つ二項確率変数:
V(X-)= E(X²) - [E(X-)]²= P - Pp²=(1-P)。

 

図2に示すように、二項分布

  コインを投げるときは、最初の時間を投げると、私たちはもう一度投げることができたときに、あること、複数のベルヌーイ試行があります。それは将来について陽性であるという意味ではありません。最初は正です。そして、それは我々がヘッドの数に投げることを意味し、ランダム変数Xをしましょう。それをどのような値Xはかかるかもしれませんか?範囲コイントスにおける合計数は、任意の負でない整数であることができます。
ランダムイベントの同じセットが存在する場合、即ち、例えばコインにおけるベルヌーイ試行のセットは、連続時間を投げます。それを発生するランダムイベントの数にも、複数のベルヌーイ分布としても知られている二項確率の対象です。
最初のテストは、現在臨床試験の結果には影響しません前に、任意のタイムトライアルは、互いに独立しています。二つの同一の実験の結果を繰り返したn回は、複数の試験の確率はベルヌーイ試験と呼ばれます。二項パラメータnおよびpは、nは試行の総数であり、pは、各試験の成功の確率です。
以上のことから、二項分布の性質がある:
1.各実験は独立している。
2. 2つだけの可能な結果、
3 n回同じ試験;
4.すべてのテストは成功率でした同じ、失敗の確率は同じです。
以下のように数学の二項分布は以下のとおりです。

 

図3は、ポアソン分布を
  使用すると、コールセンターで働く場合、どのように何回の日は、コールはそれを受け取っているのでしょうか?何回が可能です!コールセンターでは何回コールを受信するための一日は、ポアソン分布によってモデル化することができます。ここではいくつかの例は以下のとおりです。
1日1受信病院内の緊急コール番号、
レポートの数で盗難事件が1日2位を受け、
3、1時間以内にサロンの数をひいき;
4.特定の都市は、自殺を報告しました数、
ページ上の誤植5回各書籍の数。
今、あなたは同じように他の多くの例を構築することができます。いつ、どこでイベントがランダムに分布発生したポアソン分布は、我々は唯一のイベントの発生回数に興味を持っているうち、適用されます。次のようにポアソン分布の主な機能は:
1イベントの成功は、他の成功したイベントに影響を及ぼさない。
2.短い間隔の後、成功の確率は長い間隔の後に成功する確率に等しくなければならない;
3時間間隔が微小時間になる傾向があります、時間間隔内の成功の確率はゼロに近づきます。
ポアソン分布で定義されたシンボルを有する:
λは事象率であり、
Tは、イベントの間隔の長さであり;
Xイベントは、発生の時間間隔の範囲内です。
Xは、ポアソン確率変数とする、その後、Xの確率分布はポアソン分布と呼ばれています。マイクロにおける時間間隔を表すイベントの平均数Tは、μ=λ* T、
確率分布関数X:


μはポアソン分布パラメータであり、以下のように示されるポアソン確率分布:



次の図は、分布曲線の平均増加の変化を示しています。


上述したように、平均値が増加し、右側に曲線が移動します。平均およびポアソン分布の分散:
平均:E(X)=μ
分散します。var(X)=μ

 

図4は、均一に分布
  ローリングダイスのために、結果は1-6です。任意の結果を得る確率は一様分布の基礎となる、等しいです。そして数からn個のすべての可能な結果の異なるベルヌーイ分布は一様分布に等しいです。
花束の花屋日々の販売数は一様に、少なくとも10 40ほとんどで、配布されています。のは、15-30の1日の売上の確率を計算してみましょう。
15〜30の毎日の販売の確率(30-15)*(1 /(40-10))= 0.5との間の
確率同様に、毎日の販売= 0.667 20よりも大きいです

 

5、指数分布
  の深さの学習では、我々は多くの場合、0のx =で境界点(シャープポイント)分布を取得する必要があります。この目標を達成するために、我々は指数分布(指数分布)を使用することができます。


負の値の確率は、xが0であるように使用する指数分布関数(インジケータ機能)1x≥0ための命令。
ここで、λ> 0は、パラメータの確率密度関数です。確率変数XはEは(X)= 1 /λとして、変数の平均値を表すことができる、指数分布に従うものと 、 分散がヴァー(X)=(1 /ように表すことができる λ)^ 2。以下に示すようにλが大きい場合には、指数分布曲線は、λが小さい場合、曲線が平坦であり、より低下します。下図のように:


以下の単純な式は、指数分布関数のうち導出される
以下のXより曲線下面積に対応するEXP(-λx)、密度関数- P} = {X≦X. 1。
P {X> X} = EXP (-λx)、 xの代表は、確率密度関数曲線の面積よりも大きいです。
P {X1 <X≤×2} = EXP(-λx1)-exp(-λx2)、 点X1と点X2との間の曲線下面積の確率密度関数を表します。


6、正态分布(高斯分布)
  最常用的分布就是正态分布(normal distribution),也称为高斯分布(Gaussian distribution)。因为该分布的普遍性,尤其是中心极限定理的推广,一般叠加很多较小的随机变量都可以拟合为正态分布。正态分布主要有以下几个特点:
1. 所有的变量服从同一均值、方差和分布模式。
2. 分布曲线为钟型,并且沿 x=μ对称。
3. 曲线下面积的和为 1。
4. 该分布左半边的精确值等于右半边。
正态分布和伯努利分布有很大的不同,然而当伯努利试验的次数接近于无穷大时,他们的分布函数基本上是相等的。
若随机变量 X 服从于正态分布,那么 X 的概率密度可以表示为:


随机变量 X 的均值可表示为 E(X) = µ、方差可以表示为 Var(X) = σ^2。其中均值µ和标准差σ为高斯分布的参数。
随机变量 X 服从于正态分布 N (µ, σ),可以表示为:


标准正态分布可以定义为均值为 0、方差为 1 的分布函数,以下展示了标准正态分布的概率密度函数和分布图:

 

 

 

参考:

https://36kr.com/p/5094400
https://www.cnblogs.com/coloz/p/10709824.html

おすすめ

転載: www.cnblogs.com/little-sheep/p/12105137.html