伯努利分布、二项分布、几何分布、超几何分布、泊松分布

导语
       对于任何一个学习概率论的童鞋来说,各种分布都是很头痛的一件事情,本篇主要讨论的是离散型随机变量.

伯努利分布
       伯努利分布就是我们常见的0-1分布,即它的随机变量只取0或者1,各自的频率分别取1−p1−p和pp,当x=0x=0或者x=1x=1时,我们数学定义为: 
p(x)=px∗(1−p)1−x
p(x)=px∗(1−p)1−x

       其它情况下p(x)=0p(x)=0,伯努利分布是一个非常好理解的分布,也是很多其它分布的基础。
离散型随机变量期望:E(x)=∑x∗p(x)E(x)=∑x∗p(x) 
方差:D(x)=E(x2)−E2(x)D(x)=E(x2)−E2(x)
       对于伯努利分布来说,E(x)=1∗p+0∗(1−p)=p,D(x)=12∗p−p2=p(1−p)E(x)=1∗p+0∗(1−p)=p,D(x)=12∗p−p2=p(1−p)
二项分布
       二项分布是这样一种分布,假设进行n次独立实验,每次实验“成功”的概率为pp,失败的概率为1−p1−p,所有成功的次数XX就是一个参数为nn和pp的二项随机变量.数学公式定义为: 
p(k)=(nk)∗pk∗(1−p)n−k
p(k)=(nk)∗pk∗(1−p)n−k

       二项分布公式基于伯努利分布得到,因为二项分布中每项实验都是独立的,因此每一次实验都是一次伯努利实验,在nn次实验中,成功kk次,排列方式有(nk)(nk)种,根据乘法原理,即可得到二项分布的公式。
话外:对于均值和方差的计算,XiXi是标准的伯努利分布,总发生次数X=∑n1XiX=∑1nXi,所以E(X)=E(∑n1Xi)=∑n1E(Xi)=n∗pE(X)=E(∑1nXi)=∑1nE(Xi)=n∗p,同理方差D(x)=∑n1D(Xi)=n∗p∗(1−p)D(x)=∑1nD(Xi)=n∗p∗(1−p)
几何分布和负二项分布
       这是一个比较简单的分布,其中负二项分布是几何分布的一般形式,几何分布与二项分布类似,也是由nn次伯努利分布构成,随机变量XX表示第一次成功所进行试验的次数,则 
p(k)=P(X=k)=p∗(1−p)k−1,k=1,2,3,...
p(k)=P(X=k)=p∗(1−p)k−1,k=1,2,3,...

       负二项分布是几何分布的一般形式,表示直到成功r次停止,显而易见,当r=1时,它就是几何分布,则 
P(X=k)=(k−1r−1)pr∗(1−p)k−r
P(X=k)=(k−1r−1)pr∗(1−p)k−r
关于几何分布的期望与方差,E(X)=1/pE(X)=1/p,D(x)=(1−p)/p2D(x)=(1−p)/p2,关于期望的证明,E(X)=∑∞n=1n∗p∗qn−1=p∗∑∞n=1(qn)′=p∗(∑∞n=1qn)′=1/pE(X)=∑n=1∞n∗p∗qn−1=p∗∑n=1∞(qn)′=p∗(∑n=1∞qn)′=1/p,方差证明与期望证明类似,不再赘述…

超几何分布
       非常常见的一种分布,常用来表示在NN个物品中有指定商品MM个,不放回抽取nn个,抽中指定商品的个数,即XX~H(N,n,M)H(N,n,M),则抽中k件的概率为: 
p(k)=P(X=k)=(Mk)∗(N−Mn−k)(Nn)
p(k)=P(X=k)=(Mk)∗(N−Mn−k)(Nn)

       实际应用中超几何分布例子很多,比如彩票开奖你所符合的数字个数等。
泊松分布
       泊松分布是离散型随机变量分布中相对较难的一种,泊松频率函数定义为: 
P(X=k)=λk∗e−λk!,k=0,1,2,3,...
P(X=k)=λk∗e−λk!,k=0,1,2,3,...

       泊松分布是二项分布的极限形式,可有二项分布概率公式推导得出,其中λ=n∗pλ=n∗p,当n>>pn>>p时, 
p(k)=(nk)∗pk∗(1−p)n−k=n!∗pk∗(1−p)n−kk!∗(n−k)!=n!∗(λn)k∗(1−λn)n−kk!∗(n−k)!=λkk!∗n!(n−k)!∗k!∗(1−λn)n∗(1−λn)−k
p(k)=(nk)∗pk∗(1−p)n−k=n!∗pk∗(1−p)n−kk!∗(n−k)!=n!∗(λn)k∗(1−λn)n−kk!∗(n−k)!=λkk!∗n!(n−k)!∗k!∗(1−λn)n∗(1−λn)−k

当nn->∞∞时,λnλn->0,n!(n−k)!∗k!n!(n−k)!∗k!->1,(1−λn)n(1−λn)n->e−λe−λ,(1−λn)−k(1−λn)−k->1,所以 
p(k)−>λk∗e−λk!
p(k)−>λk∗e−λk!
泊松分布的期望和方差均为λλ,证明过程严格按照定义即可,注意在证明过程中使用到了eλ的泰勒展开eλ的泰勒展开
       泊松分布主要用来研究单位时间或单位空间内某时间的发生次数,同时事件的发生必须是相互独立的,比如单位时间内通过某一交通灯的车辆数等。λλ大概等于20时,泊松分布基本可以近似为正态分布进行处理。 
       泊松分布用来衡量事件的稳定性是一个不错的方法,再配合一些统计学上的检验方法,能够做很多东西,在之后的连续型随机变量中,有一种分布叫指数分布,它与泊松分布密不可分,可由泊松分布推导出
--------------------- 
作者:天空中的一缕微风 
来源:CSDN 
原文:https://blog.csdn.net/zlbflying/article/details/47777943?utm_source=copy 
版权声明:本文为博主原创文章,转载请附上博文链接!

猜你喜欢

转载自blog.csdn.net/Scythe666/article/details/83087912
今日推荐