统计-随机变量

随机变量

定义

设随机试验E的样本空间为S={e},若X=X(e)是定义在样本空间S的上的一个单值实函数,则称X=X(e)为随机变量
简单说,让每一个样本点e对应着唯一的实数X(e),便得到随机变量X=X(e)

离散型随机变量

若随机变量只可能取有限个或可数无限个值时

连续型随机变量

若随机变量只可能取一个区间中的所有实数时

随机变量的概率

随机变量X取某个值x的事件用记号{X=x}表示,其概率记为{X=x}
若L是一个实数集,将随机变量X在L中取值的事件记作{X∈L},其概率记为P{X L}
P{X∈L}=P{e|X(e)∈L}

离散型随机变量及其分布律

设离散型随机变量X所有可能的取值为xk,X取xk的概率为P{X=xk}=pk (k=1,2,…)

性质

1.非负性 Pk≥0,k=1,2,…
2.规范性 p1+p2+…+pn =1

分布律

x x1 x2 … xk
pk p1 p2 … pk

k = 1 P k = 1

X的每一个取值各占一些概率,这些概率加起来为1,即概率1以一定的规律分布着各个可能的值上。

0-1分布

定义

只取0和1两个值的随机变量所服从的分布称为0-1分布
设P{X=1}= p (0 < p <1) ,则P{X=0}=1-p
P X = k = p k ( 1 p ) 1 k ( k = 0 , 1 )

x 0 1
p_k 1-p p

二项分布

设X表示n重伯努利试验中事件A发生的次数,则X是一个随机变量,X可能的取值为0,1,…,n。
用Ai表示事件A在第i次试验中发生(i=0,1,…,n)
假设A发生在第n1,..,nk次的试验,
这k次试验A发生概率为P( A 1 ¯ A n 1 ¯ An A n + 1 ¯ A k 1 ¯ Ak A k + 1 ¯ )=(1-p)…(1-p)p(1-p)…(1-p)p(1-p)…(1-p)=pk(1-p)n-k
由于A发生在哪k次试验有 C n k

公式

P{X=k}= C n k pk(1-p)n-k
随机变量X服从参数n,p的二项分布,记为X~b(n,p)

规范性
k = 0 n C n k pk(1-p)n-k=[p+(1-p)]n=1

二项分布为0-1分布b(1,p)
P{X=k}=pk(1-p)n-k (k=0,1) (C_0^1 = C_1^1$=1)

例子

某人进行射击,每次射中命中率0。02,独立射击400次,至少中两次概率
P~b(400,0.02)
P{X=k}= C 4 00 k 0.02k(1-0.02)400-k
P{X≥2}=1-P{X=0}-P{X=1}
=1- C 4 00 0 0.020(1-0.02)400-0- C 4 00 0 0.021(1-0.02)400-1=0.9972

泊松分布

知道发生的的平均次数 λ
P = λ n
X~b(n, λ n )推出

lim n + C n k ( λ n ) k ( 1 λ n ) n k = λ k k ! e λ

定义

设随机变量X所以可能的取值为一起自然数0,1,2…,且取值k(k=0,1,2,..)的概率为

P k = P{X=k} = λ k k ! e λ
其中 λ >0的常数,则称X服从参数为 λ 的泊松分布。X~π(\lambda)

可以通过泊松分布表计算

规范性

例子

保险公司承保5000张同年龄为期一年的保单。如果合同期死亡,则赔付3万元。设1年内死亡概率为0.0015,且投保人是互为独立时间。求保险公司对于这批保险人赔付不超过30w的概率
X~b(5000,0.0015)
总赔付额为3X万元
求概率P{3X≤30}=P{X≤10}
二项分布
P{X≤10}= k = 0 10 C 5000 k 0.0015k(1-0.0015)5000-k

计算困难,用泊松分布
\lambda=np=5000×0.0015=7.5
P{X≤10}= k = 0 10 7.5 k k ! e 7.5
直接查表

几何分布 试验直到成功的概率

用Ai表示事件A在第i次试验中发生(i=0,1,…,n)假设第kci试验中A第一次发生,则
P{X=k}=P( A 1 ¯ A k 1 ¯ Ak)=(1-p)…(1-p)p=(1-p)k-1p

定义

设多重伯努利试验中,事件A发生的概率为p(0 < p < 1),记X为A第一次发生时的试验次数,则X取值k的概率
P{X=k}=(1-p)k-1p (k=1,2…)
称X服从参数为p的几何分布,记作X~G(p)

x 1 2 … k …
pk p (1-p)p … (1-p)k-1p …

规范性

k = 1 ( 1 p ) k 1 p = p k = 1 ( 1 p ) k 1 = p 1 1 ( 1 p ) = p 1 p = 1
几何级数(等比级数)
等比级数的和= 1

超几何分布

设有N件产品,其中有D件次品。今从中任取n件,问其中恰有k件次品(k≤D)的概率是多少?
在N件产品中取n件(不放回)的取法有 C N n
在D件次品中取k件的取法有 C D k
在N-D件正品中取n-k件的取法有 C N D n k
在N件产品中取n件,其中恰有k件次品的取法有 C D k C N D n k
P ( A ) = C D k C N D n k C N n

定义

设有N件产品,其中有M件次品。从中任取n件,则其中恰有k件次品(k≤M)的概率是
设随机变量X表示取出n件产品中的次品数,
则P{X=k}={ C M k C N M n k }\over { C N n } k=0,1,…,n
称X服从参数为n,M,N的超几何分布

与二项分布关系

当N很大时候,超几何分布和二项分布近似

随机变量的分布函数 累积分布函数

分布函数概率

定义

设X是一个随机变量(离散型或连续型),x是任意实数,称事件{X≤x}的概率P{X≤x}为X的分布函数,记作
F(x)=P{X≤x} 定义域整个实数域
对于任何实数x1,x2 (x1 < x2) , 都有P{x1 < X ≤ x2}=P{X ≤ x2}-P{X ≤ x1}=F(x2)-F(x1)

性质1

分布函数F(x)是实数域上( , + )的单调不减函数

性质2

0≤F(x)≤1
F( )=0 F( + )=1

性质3

分布函数F(x)至多有可数个跳跃间断点,且处处都是右连续的,即对任何实数x0,都有
F ( X 0 + 0 ) = lim x x 0 F ( x ) = F ( x 0 )

公式

P{X≤a}=F(a)
P{X<a}=F(a-0)
P{X=a}=F(a)-F(a-0)
P{X>a}=1-F(a)
P{X≥a}=1-F(a-0)
P{a≤X<b}=F(b-0)-F(a-0)
P{a<X<b}=F(b-0)-F(a)
P{a≤X≤b}=F(b)-F(a-0)

离散型随机变量的分布函数

函数概率的累积

连续型随机变量及其密度函数

连续型随机变量及其密度函数的概念

定义

如果随机变量X的分布函数F(x)可以写成以下形式:

F ( x ) = x f ( t ) d t ( < x < + )

其中f(x)是定义在 ( , + ) 上的非负可积函数,则称X为连续型随机变量,
f(x)称为X的概率密度函数。

性质1

f(x)≥0 非负性

性质2

F ( x ) = + f ( x ) d x = 1 规范性

性质3

若f(x)在x处联系,则F(x)在x处可导,且
F’(x)=f(x)

性质4

对任意实数x1,x2(x1

均匀分布

定义

若连续随机变量X具有概率密度

f ( x ) = { 1 b a a < x < b 0 ,

则称X在区间[a,b]上服从均匀分布,记为X~U(a,b
)

意义

若X~U(a,b),则X落在区间(a,b)中任意长度的子区间的可能性是相同的。
随机变量X落入每一个小区间概率都是
1 b a = ( b a ) n b a = 1 n
即落入每一个小区间都是等可能的,所以概率被均匀的分布在区间[a,b]上。

分布函数

f ( x ) = { 0 x < a x a b a a x < b 1 , x b

指数分布

定义

若连续型随机变量X具有概率密度

f ( x ) = { λ e λ x x > 0 0 , x 0 ( λ > 0 )

则称X服从参数为 λ 的指数分布,记为X~E( λ )

分布函数

f ( x ) = { 1 e λ x x > 0 0 , x 0

性质 无记忆性

s , t >0,有P{X > s+t | X>s}=P{X>t}
在一只X>s发生的条件下,则X>s+t发生的概率就等于{X>t}发生的概率
如,X是一个电子元件的寿命,若已知元件已经使用了s小时(X>s发生),它能再使用t小时(一共使用s+t小时,X>s+t发生)的概率,与它从开始使用起能用t小时的概率相等。
指数分布通常来作为各种寿命的分布

正态分布 高斯分布

若连续型随机变量X具有概率密度
f(x)= 1 2 π σ e ( x μ ) 2 2 σ 2 ( < x < + )
其中 μ , σ ( σ > 0 ) 是常数,则称X服从参数为 μ , σ 的正态分布,记作X~N( μ , σ 2 )
μ 为X的均值
σ 为方差

图像性质

1.y=f(x)的图形关于直线x= μ 对称。
即f( m u -h)=f( m u +h)
2.y=f(x)在x= μ 处的最大值f( μ )= 1 2 π σ
3.x离 μ 越远,f(x)的值越小
4.y=f(x)在x= μ + σ 有两个拐点
5.y=f(x)以x轴为其水平渐近线
6.当 σ 固定时, μ 决定y=f(x)的左右位置, μ 称为正态分布的位置参数。
7.当 μ 固定是, σ 决定y=f(x)的集中程度。 σ 越小,y=f(x)的图形越尖,越高,X落在 μ 附件概率越大

分布函数

F(x)= 1 2 π σ x e ( x μ ) 2 2 σ 2
原函数不是初等函数,只能写成积分上限函数

标准正态分布

m u =0, σ =1时的正态分布称为标准正态分布,记作X~N(0,1)
φ ( x ) = 1 2 π e x 2 2

标准化

若X~N( μ , σ 2 )则Z={X- m u \over σ }~N{0,1}
F(x)= ϕ ( x μ σ )

公式

P{X ≤ x}= ϕ ( x μ σ )
P{|X| ≤ x}= 2 ϕ ( x μ σ )-1
P{x1 < X ≤ x2}= ϕ ( x 2 μ σ )- ϕ ( x 1 μ σ )

随机变量的函数的分布

定义

设g(x)是定义在随机变量X的一切可能取值x的集合上的函数。
如果对于X的每一个可能的取值x,另一个变量Y取值相应的值y=g(x),则称Y为X的函数。记作Y=g(x)

离散型随机变量的函数的分布

连续型随机变量的函数的分布

猜你喜欢

转载自blog.csdn.net/jshazhang/article/details/79430185
今日推荐