二项式分布Binomial Distribution

二项式分布Binomial Distribution

引言

因为我在一个课题中,需要统计一个基因出现的频率数,是否有显著性,经过调研,我认为是不放回抽样的模型,所以应该使用二项式分布模型,所以这里总结一下二项式分布概率计算和R语言实现的知识。

二项分布是离散的概率分布。它描述了一个实验中n个独立试验的结果。每个试验都假定只有两种结果,要么成功,要么失败。如果一次试验成功的概率是p,那么事件X,即在n次独立试验中k次试验成功的概率为:

Binomial probability model

Problem

假设在英语课堂测验中有12道单项选择题。每个问题有五个选项,其中只有一个是正确的。如果学生准备随机回答每一个问题,请问回答正确的不到四道题目的概率。

Solution

因为五个可能的答案中只有一个是正确的,所以随机回答一个问题的正确概率是1/5=0.2。我们可以通过下面的随机尝试找出恰好有4个正确答案的概率。

> dbinom(x = 4, size=12, prob=0.2) 
[1] 0.1329

上面使用了R语言dbinom函数,我们也可以根据公式自行计算刚好答对四道题的概率,如下:

> pvalue <- factorial(12)/ factorial(4)/factorial(8) * 0.2^4 * 0.8^8 
> print(pvalue)
[1] 0.1328756

可以看到计算结果和R语言stats包中的dbinom函数的计算结果一致。

因为事件X是答对不超过四道题,所以接下来同理计算,答对0, 1, 2, 3 道题的概率,并和答对四道题的概率相加:

> dbinom(0, 12,0.2) + dbinom(1, 12,0.2) + dbinom(2, 12,0.2) + dbinom(3, 12,0.2) + dbinom(4, 12,0.2)
[1] 0.9274445

所以,根据结果得出结论,该同学全蒙的情况下,答对题目不超过4道的概率是0.927.

另外,可以发现上述逐个计算概率再求和比较麻烦,R语言提供了pbinom() 函数,如下:

> pbinom(4, size=12, prob=0.2) 
[1] 0.9274445

参考

猜你喜欢

转载自www.cnblogs.com/songbiao/p/12711359.html