前言
条件概率就是指在一个事件发生时,另一事件发生的概率。概念虽然简单,在实际在使用的时候经常让人搞混淆,所以本文通过一些示例,详细介绍条件概率。
示例:男女司机交通事故概率
某城市有男司机4000名,女司机1000名,2019年发生了250起机动车交通事故,其中男司机造成了210起,女司机造成的事故40起,根据以上数据,当年某起事故后,司机为女性的概率是多少?
设事件
A =“司机每年发生交通事故”,事件
B =“男司机”,事件
Bˉ = “女司机”,那么有:
- 所有司机每年发生交通事故的概率:
P(A)=250/(4000+1000)=0.050
- 男性司机每年发生交通事故的概率:
P(A∣B)=210/4000=0.0525
- 女性司机每年发生交通事故的概率:
P(A∣Bˉ)=40/1000=0.040
- 发生交通事故时是男性司机的概率:
P(B∣A)=210/250=0.840
- 发生交通事故时是女性司机的概率:
P(Bˉ∣A)=40/250=0.160
- 司机为男性的概率:
P(B)=4000/(1000+4000)=0.80
- 司机为女性的概率:
P(Bˉ)=2000/(1000+4000)=0.20
为了方便对比,整理如下表所示:
内容 |
男司机 |
女司机 |
备注 |
总事故率 |
- |
- |
总计为
P(A)=0.05,不分男女。 |
性别概率 |
P(B)=0.80 |
P(Bˉ)=0.20 |
|
性别事故率 |
P(A|
B)=0.0525 |
P(A|
Bˉ)=0.040 |
在性别确认的情况下,统计事故率。 |
事故性别率 |
P(B|
A)=210/250=0.840 |
P(Bˉ|
A)=40/250=0.160 |
在事故确定的情况下,统计性别比例。 |
贝叶斯公式
根据贝叶斯公式,可得:
P(B∣A)=P(A∣B)P(B)+P(A∣Bˉ)P(Bˉ)P(A∣B)P(B)=0.0525×0.80+0.04×0.200.0525×0.80=0.84
P(Bˉ∣A)=P(A∣B)P(B)+P(A∣Bˉ)P(Bˉ)P(A∣Bˉ)P(Bˉ)=0.84×0.667+0.16×0.3330.16×0.333=0.16
与上面直接计算的结果一致。
我们再来统计
P(AB) 和
P(ABˉ),由于
P(AB)=P(B∣A)P(A)=P(A∣B)P(B),所以分别可以计算如下:
P(AB)=P(B∣A)P(A)=0.84∗0.05=0.42P(AB)=P(A∣B)P(B)=0.0525∗0.80=0.42
可见,两种计算方式结果相同。同样地,对于
P(ABˉ) 有:
P(ABˉ)=P(Bˉ∣A)P(A)=0.16∗0.05=0.08
P(ABˉ)=P(A∣Bˉ)P(Bˉ)=0.040∗0.20=0.08
全概率公式
另外,根据全概率公式:
P(A)=P(A∣B)P(B)+P(A∣Bˉ)P(Bˉ),将数据代入,可得
P(A∣B)P(B)+P(A∣Bˉ)P(Bˉ)=0.0525∗0.80+0.04∗0.20=0.05=P(A)
结果与预期一致。
小结
综上所述,在条件概率
P(Y∣X)中,
X 是已经发生了的确定事件,即概率的条件,而
Y 是要求的概率。比如,求“女司机的事故概率”,女司机是已经确定的,而所要求的是事故概率,所以概率表达式为
P(事故∣女司机)。反之,如果是求事故发生时女司机的概率,那么事故是已经发生的,是前提条件,所要求的是女司机的概率,所以表达式可以写成
P(女司机∣事故),这就是条件概率的本质含义。