一个案例讲清楚条件概率与贝叶斯公式

前言

条件概率就是指在一个事件发生时,另一事件发生的概率。概念虽然简单,在实际在使用的时候经常让人搞混淆,所以本文通过一些示例,详细介绍条件概率。

示例:男女司机交通事故概率

某城市有男司机4000名,女司机1000名,2019年发生了250起机动车交通事故,其中男司机造成了210起,女司机造成的事故40起,根据以上数据,当年某起事故后,司机为女性的概率是多少?

设事件 A A =“司机每年发生交通事故”,事件 B B =“男司机”,事件 B ˉ \bar{B} = “女司机”,那么有:

  • 所有司机每年发生交通事故的概率: P ( A ) = 250 / ( 4000 + 1000 ) = 0.050 P(A)=250/(4000+1000)= 0.050
  • 男性司机每年发生交通事故的概率: P ( A B ) = 210 / 4000 = 0.0525 P(A|B)=210/4000= 0.0525
  • 女性司机每年发生交通事故的概率: P ( A B ˉ ) = 40 / 1000 = 0.040 P(A|\bar{B})=40/1000 = 0.040
  • 发生交通事故时是男性司机的概率: P ( B A ) = 210 / 250 = 0.840 P(B | A) = 210/250=0.840
  • 发生交通事故时是女性司机的概率: P ( B ˉ A ) = 40 / 250 = 0.160 P(\bar{B} | A)= 40/250 = 0.160
  • 司机为男性的概率: P ( B ) = 4000 / ( 1000 + 4000 ) = 0.80 P(B) = 4000/(1000+4000)=0.80
  • 司机为女性的概率: P ( B ˉ ) = 2000 / ( 1000 + 4000 ) = 0.20 P(\bar{B}) = 2000/(1000+4000)=0.20

为了方便对比,整理如下表所示:

内容 男司机 女司机 备注
总事故率 - - 总计为 P ( A ) = 0.05 P(A)=0.05 ,不分男女。
性别概率 P ( B ) = 0.80 P(B) = 0.80 P ( B ˉ ) = 0.20 P(\bar{B}) = 0.20
性别事故率 P ( A P(A | B ) = 0.0525 B)=0.0525 P ( A P(A | B ˉ ) = 0.040 \bar{B})=0.040 在性别确认的情况下,统计事故率。
事故性别率 P ( B P(B | A ) = 210 / 250 = 0.840 A) = 210/250=0.840 P ( B ˉ P(\bar{B} | A ) = 40 / 250 = 0.160 A) = 40/250=0.160 在事故确定的情况下,统计性别比例。

贝叶斯公式

根据贝叶斯公式,可得:
P ( B A ) = P ( A B ) P ( B ) P ( A B ) P ( B ) + P ( A B ˉ ) P ( B ˉ ) = 0.0525 × 0.80 0.0525 × 0.80 + 0.04 × 0.20 = 0.84 P(B|A)=\frac{P(A|B)P(B)}{P(A|B)P(B)+P(A|\bar{B})P(\bar{B})}= \frac{0.0525 \times 0.80}{0.0525 \times 0.80 + 0.04 \times 0.20}=0.84

P ( B ˉ A ) = P ( A B ˉ ) P ( B ˉ ) P ( A B ) P ( B ) + P ( A B ˉ ) P ( B ˉ ) = 0.16 × 0.333 0.84 × 0.667 + 0.16 × 0.333 = 0.16 P(\bar{B}|A)=\frac{P(A|\bar{B})P(\bar{B})}{P(A|B)P(B)+P(A|\bar{B})P(\bar{B})}= \frac{0.16 \times 0.333}{0.84 \times 0.667 + 0.16 \times 0.333}=0.16

与上面直接计算的结果一致。

我们再来统计 P ( A B ) P(AB) P ( A B ˉ ) P(A\bar{B}) ,由于 P ( A B ) = P ( B A ) P ( A ) = P ( A B ) P ( B ) P(AB) = P(B | A) P(A)= P(A | B) P(B) ,所以分别可以计算如下:
P ( A B ) = P ( B A ) P ( A ) = 0.84 0.05 = 0.42 P ( A B ) = P ( A B ) P ( B ) = 0.0525 0.80 = 0.42 P(AB) = P(B | A) P(A)=0.84*0.05=0.42\\ P(AB) = P(A | B) P(B)=0.0525*0.80=0.42

可见,两种计算方式结果相同。同样地,对于 P ( A B ˉ ) P(A\bar{B}) 有:

P ( A B ˉ ) = P ( B ˉ A ) P ( A ) = 0.16 0.05 = 0.08 P(A\bar{B}) = P(\bar{B} | A) P(A)=0.16*0.05=0.08
P ( A B ˉ ) = P ( A B ˉ ) P ( B ˉ ) = 0.040 0.20 = 0.08 P(A\bar{B}) = P(A | \bar{B}) P(\bar{B})=0.040*0.20=0.08

全概率公式

另外,根据全概率公式: P ( A ) = P ( A B ) P ( B ) + P ( A B ˉ ) P ( B ˉ ) P(A) = P(A | B) P(B) + P(A|\bar{B})P(\bar{B}) ,将数据代入,可得 P ( A B ) P ( B ) + P ( A B ˉ ) P ( B ˉ ) = 0.0525 0.80 + 0.04 0.20 = 0.05 = P ( A ) P(A | B) P(B) + P(A|\bar{B})P(\bar{B}) = 0.0525 * 0.80 + 0.04 * 0.20 = 0.05=P(A)

结果与预期一致。

小结

综上所述,在条件概率 P ( Y X ) P(Y|X) 中, X X 是已经发生了的确定事件,即概率的条件,而 Y Y 是要求的概率。比如,求“女司机的事故概率”,女司机是已经确定的,而所要求的是事故概率,所以概率表达式为 P ( ) P(事故 | 女司机) 。反之,如果是求事故发生时女司机的概率,那么事故是已经发生的,是前提条件,所要求的是女司机的概率,所以表达式可以写成 P ( ) P(女司机 | 事故) ,这就是条件概率的本质含义。

发布了326 篇原创文章 · 获赞 94 · 访问量 19万+

猜你喜欢

转载自blog.csdn.net/weixin_43145361/article/details/103998587