【統計ノート】(14)確率と確率分布

確率と確率分布

確率は、偶発的な発生の確率を測定する数値です。試行を繰り返した後(Xで表示)、偶発的なイベント(Aで表示)が数回(Yで表示)発生したとします。Xを分母、Yを分子として、数値(Pで表される)が形成されます。多くの実験では、Pは特定の値で比較的安定しており、PはAの出現確率と呼ばれます。偶発的なイベントの確率が長期間の観察または多数の反復試行によって決定される場合、この確率は統計的確率または経験的確率です。

インシデントを管理する内部法則を研究する規律は、確率論と呼ばれます。数学のブランチに属しています。確率論は、偶発的な現象に含まれる内部法則の出現を明らかにします。したがって、確率は、自然現象や社会現象に対する人々の理解に重要な影響を及ぼします。

確率の古典的な定義

テストが2つの条件を満たす場合:
(1)テストには限られた数の基本結果しかない;
(2)テストの各基本結果の確率は同じである。
そのような実験は古典的な実験です。
古典的な実験のイベントAの場合、その確率は次のように定義されます。\ large P(A)= \ tfrac {m} {n}ここで、nは実験で考えられるすべての基本的な結果の総数を表します。mは、イベントAに含まれる基本的なテスト結果の数を表します。この確率を定義する方法は、古典的な確率の定義と呼ばれます。

古典的確率はランダムな試行の範囲に限定され、可能な結果の数は限られているため、その適用は制限されます。したがって、人々は繰り返し試行の頻度に基づいてイベントの確率を決定する方法、つまり確率の統計的定義を提案しています。

確率の統計的定義

同じ条件の下で、ランダムテストはn回、イベントAはm回表示され(\ large m \ leqslant n)、比率は\大\ frac {m} {n}イベントAの頻度と  呼ばれます。nが増加すると、周波数は定数pを中心に上下に変動し、変動の振幅は徐々に減少して安定する傾向があります。この周波数の安定値は、次のように記録されるイベントの確率です。

\ large P(A)= \ tfrac {m} {n} = p

例:


ランダムなイベントとその確率

特定の条件下で発生する場合と発生しない場合があるイベントは、ランダムイベントと呼ばれます。
通常、実験のイベントは基本的なイベントで構成されます。実験で可能な結果がn個ある場合、つまり、実験がn個の基本イベントで構成されており、すべての結果が同程度である場合、そのようなイベントは等イベントと呼ばれます。
相互に排他的なイベント:同時に発生できない2つのイベントは、相互に排他的なイベントと呼ばれます。
反対のイベント:つまり、反対のイベントと呼ばれる相互に排他的なイベントがなければなりません。

特定のランダム化試験では、それぞれの結果として起こり得る前記基本イベント、イベントはすべての基本的な根本的な空間のセットと呼ばれます。

ランダムイベント(イベントと呼ばれます)はいくつかの基本的なイベントで構成されます。たとえば、2つのサイコロを続けて転がすランダムテストでは、ZとYを使用して、最初と2番目の発生のポイントをそれぞれ示します。値1、2、3、4、5、6は各ポイント(Z、Y)が基本イベントを表すため、基本スペースには36の要素が含まれます。「ポイントの合計は2」であるイベントであり、セット{(1、1)}で表すことができる基本イベント(1、1)で構成されます。「ポイントの合計は4」もイベントです。 、3)、(2、2)、(3、1)は3つの基本イベントで構成され、セット{(1、3)、(3、1)、(2、2)}で表すことができます。

「ポイントの合計が1」もイベントとみなすと、基本的なイベントが含まれていないイベントであり、不可能なイベントと呼ばれます。P(不可能イベント)= 0。

このイベントは実験では発生しません。「ポイントの合計が40未満」をイベントと見なす場合、イベントにはすべての基本イベントが含まれます。このイベントは、テストで発生する必要があり、不可避イベントと呼ばれます。P(必要なイベント)= 1。実際の生活では、さまざまなイベントとその関係、基本空間の要素のさまざまなサブセットとそれらの関係などを研究する必要があります。


離散確率変数とその分布

確率変数の定義

ランダム変数(ランダム変数)は、ランダム実験のさまざまな結果の実数値の単一値関数を表します。ランダムイベントは、数量に直接関係しているかどうかに関係なく、定量化できます。つまり、量子化された方法で表現できます。簡単に言うと、ランダム変数はランダムイベントの数を指しますたとえば、サイコロを振ったときに表示されるポイントの数、特定の期間内に電話交換機が受信した通話の数、ランダムに確認された人の身長、液体中に浮遊している粒子の特定の方向の変位などはすべてランダム変数です。例。

実験を行う場合、それは多くの場合テスト結果自体に関連しており、依然として主に結果のいくつかの機能に関心があります。たとえば、サイコロを振るとき、2つのサイコロのポイントと数を気にすることがよくあり、実際の結果はあまり気にしません。つまり、ポイントと数は7ですが、実際の結果は気にしません。結果が(1、6)または(2、5)または(3、4)または(4、3)または(5、2)または(6、1)であるかどうか。私たちが注目する量、またはより正式には、サンプル空間で定義されたこれらの実数値関数は、確率変数と呼ばれます。
確率変数の値はテスト結果によって決定されるため、確率変数の可能な値に確率を割り当てることができます。

ランダム変数は、離散ランダム変数と連続ランダム変数に分けることができます。

離散
離散(離散)確率変数は、変数の値が特定の間隔内で制限またはカウント可能であることを意味します。

たとえば、特定の年の特定の地域における人口の出生と死亡の数、特定の疾患に対して特定の薬で治療された患者の有効数と無効数など。

離散確率変数は通常、確率質量関数に従って分類され、主にベルヌーイ確率変数、二項確率変数、幾何確率変数、ポアソン確率変数に分類されます。
 

連続型
(連続)ランダム変数とは、特定の間隔に無限の数の変数があるか、値を1つずつリストできないことを意味します。

たとえば、特定の地域における男性の健康な成人の長さと体重の値、および感染性肝炎患者のグループにおける血清トランスアミナーゼの測定値。

確率論によく現れる重要な連続確率変数がいくつかあります。たとえば、一様確率変数、指数確率変数、ガンマ確率変数、通常確率変数などです。


離散確率変数の確率分布

離散確率変数の期待値と分散

 

離散確率変数の一般的な分布

  • 0-1分布
  • 二項分布(ベルヌーイ分布)
  • ポアソン分布

0-1分布

ランダム変数は、0と1の2つの値しか取ることができません。その分布則は次のとおりです。

または逆アセンブルして次のように書く

 分布法表は次のとおりです。

\ラージX \大0 \大1
\ large p_ {k} \ラージ1-p \大p

 

 

 

二項分布(ベルヌーイ分布)

ベルヌーイ分布は確率変数Xを参照します。パラメーターがp(0 <p <1)であり、確率pと1-pが1と0を値として取る場合。EX = p、DX = p(1-p)。成功したベルヌーイ試行の数はベルヌーイ分布に従い、パラメーターpは成功の確率です。ベルヌーイ分布は離散確率分布であり、N = 1での二項分布の特殊なケースです。スイスの科学者ジェームズベルヌーイ(ジェームズベルヌーイまたはジェームズベルヌーイ)にちなんで名付けられました。

ベルヌーイ検定

ランダム変数の無限シーケンス場合\ large X {_ {1}}、X {_ {2}}、……......、\ large X_ {n} (i.i.d.)独立同一分布し、各ランダム変数\ large X_ {i}のパラメータにさらされる\大pベルヌーイ分布は、確率変数\ large X {_ {1}}、X {_ {2}}、……...、\ large X_ {n}形成パラメータ\大pの一連のベルヌーイ検定。同様に、\ラージnランダム変数\ large X {_ {1}}、X {_ {2}}、……......、\ large X_ {n}IID、およびパラメータの対象となる\大p確率変数のベルヌーイ分布\ large X {_ {1}}、X {_ {2}}、……......、\ large X_ {n}パラメータとして形成\大p\ラージn重量ベルヌーイ試験。

均一なコインが繰り返し投げられると仮定して、説明するいくつかの例を次に示します。最初の\大きい私投げに正の側が現れる場合、順序\ large X_ {i} = 1;反対側が現れる場合、順序\ large X_ {i} = 0、次に、確率変数\ large X {_ {1}}、X {_ {2}}、……...、\ large X_ {n}パラメータ\ large p = \ frac {1} {2}付きの一連のベルヌーイを形成このテストでも、特定の機械で製造された部品の10%に欠陥があると想定しています\ラージn。観察する部品をランダムに選択します\大きい私最初の部品に欠陥がある場合は注文し\ large X_ {i} = 1ます。欠陥がない場合は注文し\ large X_ {i} = 0、確率変数\ large X {_ {1}}、X {_ {2}}、……... \ large X_ {n}が形成されますパラメータがあるベルヌーイ試験の重量。\ large p = \ frac {1} {10}\ラージn

ポアソン分布

確率変数の\ラージX可能な値は0、1、2、⋅⋅⋅であり、各値をとる確率は次のとおりです。

ここで\ large \ lambda> 0数学的期待値のポアソン分布または分散されている(数学的期待値と分散はポアソン分布に等しく、パラメータが等しい\ラージ\ラムダ)と呼ばれる\ラージXパラメータに被写体\ラージ\ラムダポアソン分布の、と呼ばれる:\ラージX 〜  \ large \ pi \ left(\ lambda \ right)

ポアソン分布のパラメーターは1つだけ\ラージ\ラムダです。


連続確率変数の確率分布

連続確率変数は特定の間隔またはこの実数軸で任意の値を取ることができるため、各値とそれに対応する確率を離散確率変数としてリストすることはできませんが、通常は数学的な他の方法を使用する必要があります関数と分布関数について説明します。関数を\大f(x)使用して連続確率変数を表す場合、これを\大f(x)確率密度関数(Probability Density Function)呼びます。

なお  \大f(x)れない確率\ large f(x)\ neq P(X = x)\大f(x)確率密度関数と呼ばれ、\ large P(X = x)連続分布の条件下でゼロ。連続分布の場合、曲線の下の領域は確率を表します。たとえば、aとbの間の確率変数Xの確率は次のように書くことができます。

つまり、下の図の影付きの領域です。

 

連続確率変数の期待値と分散は、次のように定義されます。

連続確率変数の分布:

  • 均等に分散
  • 指数分布
  • 正規分布

均等に分散

指数分布

正規分布

 

正規分布の期待値が\大\ muその位置を決定し、その標準偏差\ラージ\アルファが分布の振幅を決定します。最大値の式からわかるように\ラージ\アルファ、グラフが小さくなるほど、グラフは鋭くなり、したがって、近くに\ラージX落ちる\大\ mu可能性が高くなります。

 

元の記事646件を公開 賞賛された198件 690,000回

おすすめ

転載: blog.csdn.net/seagal890/article/details/105472269