机器学习|二项分布(贝努里概型、二项分布的泊松近似,正态近似)|10mins入门|概统学习笔记(五)
其他
2020-04-01 18:15:02
阅读次数: 0
二项分布
1.贝努里概型
-
定义:n次独立重复试验称作n重贝努里试验,每次试验成功的概率都是p,失败的概率都是q=1-p
-
内容:
用X表示n重贝努里试验中事件A(成功)出现的次数,则
P(X=k)=Cnkpk(1−p)n−k,k=0,1,...,n
不难验证:
a.P(X=k)≥0b.k=0∑nP(X=k)=1
-
二项分布
-
称
r.vX服从参数为n和p的二项分布,记作X~B(n,p)
-
二项分布描述的是n重贝努里试验中出现“成功”次数X的概率分布
-
图形特点:对于固定n及p,当k增加时,概率P(X=k)先是增加至达到最大值,随后单调减少。
-
当(n+1)p不为整数时,二项概率
P(X=k)在
k=[(n+1)p]达到最大值。
([x]表示不超过x的最大整数)
-
当(n+1)p为整数时,二项概率
P(X=k)在
k=(n+1)p和
k=(n+1)p−1达到最大值。
-
当n=1时,
P(X=k)=pk(1−p),k=0,1。称X服从0-1分布
-
使用条件:
-
每次试验条件相同
-
每次试验只考虑两个互逆结果
A或
A,且
P(A)=p,P(A)=1−p
-
各次试验相互独立
2. 二项分布的泊松近似
-
背景:当试验次数n很大时,计算二项概率变得很麻烦。
-
如1000件产品,只有一件次品,要求有放回地抽5000次,其中至少5次出现次品的概率。
则要计算
P(X>5)=k=6∑5000P(X=k)=k=6∑5000C5000k(10001)k(1000999)5000−k
因此必须寻求近似方法,由此引入二项分布的泊松近似
-
泊松定理
设
λ是一个正整数,
pn=nλ,则有
limn→∞Cnkpnk(1−pn)n−k=e−λk!λk, k=0,1,2,...
定理的条件意味着当n很大时,
pn必定很小。因此,泊松定理表明,当n很大,p很小时有以下近似式:
Cnkpnk(1−pn)n−k≈e−λk!λk, λ=np
实际计算中,
n≥100,np≤10时近似效果就很好。
3. 二项分布的正态近似
-
定理(棣莫佛-拉普拉斯定理)
设随机变量
Yn服从参数
n,p(0<p<1)的二项分布,则对任意x,有
limn→∞P{np(1−p)
Yn−np≤x}=∫−∞x2π
1exp(−2t2)dt
当n很大,
0<p<1是一个定值时,或者说,
np(1−p)也不太小时,二项变量
Yn的分布近似正态分布
N(np,np(1−p)).
实用中,
n≥30,
np≥10时,正态近似的效果较好
发布了37 篇原创文章 ·
获赞 0 ·
访问量 813
转载自blog.csdn.net/SanyHo/article/details/105162394