一、贝叶斯公式
1、单事件
P ( A x ∣ B ) P(A_x|B) P(Ax∣B) = P ( A x B ) P ( B ) = P ( B ∣ A x ) × P ( A x ) P ( B ) = P ( B ∣ A x ) × P ( A x ) ∑ i = 0 n [ P ( B ∣ A i ) ∗ P ( A i ) ] =\frac{P(A_xB)}{P(B)}=\frac{P(B|A_x)×P(A_x)}{P(B)}=\frac{P(B|A_x)×P(A_x)}{\sum_{i=0}^n[P(B|A_i)*P(A_i)]} =P(B)P(AxB)=P(B)P(B∣Ax)×P(Ax)=∑i=0n[P(B∣Ai)∗P(Ai)]P(B∣Ax)×P(Ax)
= A x 条 件 下 B 的 似 然 度 × A x 的 先 验 概 率 事 件 B 的 先 验 概 率 =\frac{A_x条件下B的似然度 × A_x的先验概率}{事件B的先验概率} =事件B的先验概率Ax条件下B的似然度×Ax的先验概率
= A x 条 件 下 B 的 似 然 度 × A x 的 先 验 概 率 ∑ i = 0 n ( A i 条 件 下 B 的 似 然 度 × A i 的 先 验 概 率 ) =\frac{A_x条件下B的似然度 × A_x的先验概率}{\sum_{i=0}^n(A_i条件下B的似然度 × A_i的先验概率)} =∑i=0n(Ai条件下B的似然度×Ai的先验概率)Ax条件下B的似然度×Ax的先验概率
= A x 条 件 下 B 的 似 然 度 × A x 的 先 验 概 率 边 际 似 然 度 =\frac{A_x条件下B的似然度 × A_x的先验概率}{边际似然度} =边际似然度Ax条件下B的似然度×Ax的先验概率
= A x 条 件 下 B 的 似 然 度 × A x 的 先 验 概 率 标 准 化 常 量 =\frac{A_x条件下B的似然度 × A_x的先验概率}{标准化常量} =标准化常量Ax条件下B的似然度×Ax的先验概率
= 标 准 似 然 度 × 先 验 概 率 =标准似然度 × 先验概率 =标准似然度×先验概率
- P ( A x ∣ B ) P(A_x|B) P(Ax∣B)是已知事件 B B B发生的情况下事件 A x A_x Ax发生的概率(条件概率),也由于得自 B B B的取值而被称为 A x A_x Ax的后验概率;
- P ( B ∣ A x ) P(B|A_x) P(B∣Ax)是已知事件 A x A_x Ax发生的情况下事件 B B B发生的概率,称为似然度/似然概率(likehood);
- A 1 A_1 A1, A 2 A_2 A2, …, A i A_i Ai, … , A x A_x Ax, …, A j A_j Aj, …, A n A_n An为完备事件组,即 ⋃ i = 1 n \bigcup_{i=1}^n ⋃i=1n= Ω \Omega Ω, A i A j = ϕ A_iA_j =\phi AiAj=ϕ, P ( A i ) > 0 P(A_i) > 0 P(Ai)>0;
- P ( A x ) P(A_x) P(Ax):先验概率,之所以称为"先验"是因为它为不需要考虑任何事件 B B B方面的因素的情况下事件 A x A_x Ax发生的概率;
- P ( B ) P(B) P(B):边际似然度,当给定 A i A_i Ai时, A i A_i Ai能解释 B B B的可能性,这就反应了事件 B B B的似然性,将所有 A i A_i Ai条件下事件B分别发生的概率相加得到事件 B B B的边际似然概率,它是一个标准化常量;
- P ( B ∣ A x ) P ( B ) \frac{P(B|A_x)}{P(B)} P(B)P(B∣Ax) 称为标准似然度;
- 后验概率 ∝ 似然度 × 先验概率
- 在贝叶斯概率理论中,如果后验概率 P ( A x ∣ B ) P(A_x|B) P(Ax∣B) 与 先验概率 P ( A x ) P(A_x) P(Ax) 满足同样的分布律,则 先验分布与后验分布被叫做“共轭分布”,同时,先验分布叫做似然函数的“共轭先验分布”。
2、联合事件
P [ A x ∣ ( B 1 , B 2 , . . . B i ) ] P[A_x|(B_1, B_2, ...B_i)] P[Ax∣(B1,B2,...Bi)] = P [ ( B 1 , B 2 , . . . B i ) ∣ A x ] × P ( A x ) ∑ i = 0 n { P [ ( B 1 , B 2 , . . . B i ) ∣ A i ] ∗ P ( A i ) } =\frac{P[(B_1, B_2, ...B_i)|A_x]×P(A_x)}{\sum_{i=0}^n\{P[(B_1, B_2, ...B_i)|A_i]*P(A_i)\}} =∑i=0n{ P[(B1,B2,...Bi)∣Ai]∗P(Ai)}P[(B1,B2,...Bi)∣Ax]×P(Ax)
= A x 条 件 下 ( B 1 , B 2 , . . . B i ) 的 似 然 度 × A x 的 先 验 概 率 事 件 ( B 1 , B 2 , . . . B i ) 的 先 验 概 率 =\frac{A_x条件下(B_1, B_2, ...B_i)的似然度 × A_x的先验概率}{事件(B_1, B_2, ...B_i)的先验概率} =事件(B1,B2,...Bi)的先验概率Ax条件下(B1,B2,...Bi)的似然度×Ax的先验概率
= A x 条 件 下 ( B 1 , B 2 , . . . B i ) 的 似 然 度 × A x 的 先 验 概 率 ∑ i = 0 n ( A i 条 件 下 ( B 1 , B 2 , . . . B i ) 的 似 然 度 × A i 的 先 验 概 率 ) =\frac{A_x条件下(B_1, B_2, ...B_i)的似然度 × A_x的先验概率}{\sum_{i=0}^n(A_i条件下(B_1, B_2, ...B_i)的似然度 × A_i的先验概率)} =∑i=0n(Ai条件下(B1,B2,...Bi)的似然度×Ai的先验概率)Ax条件下(B1,B2,...Bi)的似然度×Ax的先验概率
= A x 条 件 下 ( B 1 , B 2 , . . . B i ) 的 似 然 度 × A x 的 先 验 概 率 边 际 似 然 度 =\frac{A_x条件下(B_1, B_2, ...B_i)的似然度 × A_x的先验概率}{边际似然度} =边际似然度Ax条件下(B1,B2,...Bi)的似然度×Ax的先验概率
= A x 条 件 下 ( B 1 , B 2 , . . . B i ) 的 似 然 度 × A x 的 先 验 概 率 标 准 化 常 量 =\frac{A_x条件下(B_1, B_2, ...B_i)的似然度 × A_x的先验概率}{标准化常量} =标准化常量Ax条件下(B1,B2,...Bi)的似然度×Ax的先验概率
= 标 准 似 然 度 × 先 验 概 率 =标准似然度 × 先验概率 =标准似然度×先验概率
事件 B 1 , B 2 , . . . B i B_1, B_2, ...B_i B1,B2,...Bi之间有可能是独立的,也可能是相关的。
-
如果 B 1 , B 2 , . . . B i B_1, B_2, ...B_i B1,B2,...Bi之间相互独立,则
P [ ( B 1 , B 2 , . . . B i ) ∣ A x ] = P ( B 1 ∣ A x ) × P ( B 2 ∣ A x ) × . . . P ( B i ∣ A x ) P[(B_1, B_2, ...B_i)|A_x]=P(B_1|A_x)×P(B_2|A_x)×...P(B_i|A_x) P[(B1,B2,...Bi)∣Ax]=P(B1∣Ax)×P(B2∣Ax)×...P(Bi∣Ax)
-
如果 B 1 , B 2 , . . . B i B_1, B_2, ...B_i B1,B2,...Bi之间相关,则
P [ ( B 1 , B 2 , . . . B i ) ∣ A x ≠ P ( B 1 ∣ A x ) × P ( B 2 ∣ A x ) × . . . P ( B i ∣ A x ) P[(B_1, B_2, ...B_i)|A_x≠P(B_1|A_x)×P(B_2|A_x)×...P(B_i|A_x) P[(B1,B2,...Bi)∣Ax=P(B1∣Ax)×P(B2∣Ax)×...P(Bi∣Ax)