人工智能-自然语言处理(NLP):Noisy Channel Model(噪音通道模型)【各种信号 ----转换----> 文本】

在这里插入图片描述

一、贝叶斯公式

在这里插入图片描述

1、单事件

P ( A x ∣ B ) P(A_x|B) P(AxB) = P ( A x B ) P ( B ) = P ( B ∣ A x ) × P ( A x ) P ( B ) = P ( B ∣ A x ) × P ( A x ) ∑ i = 0 n [ P ( B ∣ A i ) ∗ P ( A i ) ] =\frac{P(A_xB)}{P(B)}=\frac{P(B|A_x)×P(A_x)}{P(B)}=\frac{P(B|A_x)×P(A_x)}{\sum_{i=0}^n[P(B|A_i)*P(A_i)]} =P(B)P(AxB)=P(B)P(BAx)×P(Ax)=i=0n[P(BAi)P(Ai)]P(BAx)×P(Ax)

= A x 条 件 下 B 的 似 然 度 × A x 的 先 验 概 率 事 件 B 的 先 验 概 率 =\frac{A_x条件下B的似然度 × A_x的先验概率}{事件B的先验概率} =BAxB×Ax

= A x 条 件 下 B 的 似 然 度 × A x 的 先 验 概 率 ∑ i = 0 n ( A i 条 件 下 B 的 似 然 度 × A i 的 先 验 概 率 ) =\frac{A_x条件下B的似然度 × A_x的先验概率}{\sum_{i=0}^n(A_i条件下B的似然度 × A_i的先验概率)} =i=0n(AiB×Ai)AxB×Ax

= A x 条 件 下 B 的 似 然 度 × A x 的 先 验 概 率 边 际 似 然 度 =\frac{A_x条件下B的似然度 × A_x的先验概率}{边际似然度} =AxB×Ax

= A x 条 件 下 B 的 似 然 度 × A x 的 先 验 概 率 标 准 化 常 量 =\frac{A_x条件下B的似然度 × A_x的先验概率}{标准化常量} =AxB×Ax

= 标 准 似 然 度 × 先 验 概 率 =标准似然度 × 先验概率 =×

  • P ( A x ∣ B ) P(A_x|B) P(AxB)是已知事件 B B B发生的情况下事件 A x A_x Ax发生的概率(条件概率),也由于得自 B B B的取值而被称为 A x A_x Ax后验概率
  • P ( B ∣ A x ) P(B|A_x) P(BAx)是已知事件 A x A_x Ax发生的情况下事件 B B B发生的概率,称为似然度/似然概率(likehood);
  • A 1 A_1 A1, A 2 A_2 A2, …, A i A_i Ai, … , A x A_x Ax, …, A j A_j Aj, …, A n A_n An完备事件组,即 ⋃ i = 1 n \bigcup_{i=1}^n i=1n= Ω \Omega Ω A i A j = ϕ A_iA_j =\phi AiAj=ϕ P ( A i ) > 0 P(A_i) > 0 P(Ai)>0
  • P ( A x ) P(A_x) P(Ax)先验概率,之所以称为"先验"是因为它为不需要考虑任何事件 B B B方面的因素的情况下事件 A x A_x Ax发生的概率;
  • P ( B ) P(B) P(B)边际似然度,当给定 A i A_i Ai时, A i A_i Ai能解释 B B B的可能性,这就反应了事件 B B B的似然性,将所有 A i A_i Ai条件下事件B分别发生的概率相加得到事件 B B B的边际似然概率,它是一个标准化常量
  • P ( B ∣ A x ) P ( B ) \frac{P(B|A_x)}{P(B)} P(B)P(BAx) 称为标准似然度
  • 后验概率 ∝ 似然度 × 先验概率
  • 在贝叶斯概率理论中,如果后验概率 P ( A x ∣ B ) P(A_x|B) P(AxB) 与 先验概率 P ( A x ) P(A_x) P(Ax) 满足同样的分布律,则 先验分布与后验分布被叫做“共轭分布”,同时,先验分布叫做似然函数的“共轭先验分布”。

2、联合事件

P [ A x ∣ ( B 1 , B 2 , . . . B i ) ] P[A_x|(B_1, B_2, ...B_i)] P[Ax(B1,B2,...Bi)] = P [ ( B 1 , B 2 , . . . B i ) ∣ A x ] × P ( A x ) ∑ i = 0 n { P [ ( B 1 , B 2 , . . . B i ) ∣ A i ] ∗ P ( A i ) } =\frac{P[(B_1, B_2, ...B_i)|A_x]×P(A_x)}{\sum_{i=0}^n\{P[(B_1, B_2, ...B_i)|A_i]*P(A_i)\}} =i=0n{ P[(B1,B2,...Bi)Ai]P(Ai)}P[(B1,B2,...Bi)Ax]×P(Ax)

= A x 条 件 下 ( B 1 , B 2 , . . . B i ) 的 似 然 度 × A x 的 先 验 概 率 事 件 ( B 1 , B 2 , . . . B i ) 的 先 验 概 率 =\frac{A_x条件下(B_1, B_2, ...B_i)的似然度 × A_x的先验概率}{事件(B_1, B_2, ...B_i)的先验概率} =(B1,B2,...Bi)Ax(B1,B2,...Bi)×Ax

= A x 条 件 下 ( B 1 , B 2 , . . . B i ) 的 似 然 度 × A x 的 先 验 概 率 ∑ i = 0 n ( A i 条 件 下 ( B 1 , B 2 , . . . B i ) 的 似 然 度 × A i 的 先 验 概 率 ) =\frac{A_x条件下(B_1, B_2, ...B_i)的似然度 × A_x的先验概率}{\sum_{i=0}^n(A_i条件下(B_1, B_2, ...B_i)的似然度 × A_i的先验概率)} =i=0n(Ai(B1,B2,...Bi)×Ai)Ax(B1,B2,...Bi)×Ax

= A x 条 件 下 ( B 1 , B 2 , . . . B i ) 的 似 然 度 × A x 的 先 验 概 率 边 际 似 然 度 =\frac{A_x条件下(B_1, B_2, ...B_i)的似然度 × A_x的先验概率}{边际似然度} =Ax(B1,B2,...Bi)×Ax

= A x 条 件 下 ( B 1 , B 2 , . . . B i ) 的 似 然 度 × A x 的 先 验 概 率 标 准 化 常 量 =\frac{A_x条件下(B_1, B_2, ...B_i)的似然度 × A_x的先验概率}{标准化常量} =Ax(B1,B2,...Bi)×Ax

= 标 准 似 然 度 × 先 验 概 率 =标准似然度 × 先验概率 =×

事件 B 1 , B 2 , . . . B i B_1, B_2, ...B_i B1,B2,...Bi之间有可能是独立的,也可能是相关的。

  1. 如果 B 1 , B 2 , . . . B i B_1, B_2, ...B_i B1,B2,...Bi之间相互独立,则

    P [ ( B 1 , B 2 , . . . B i ) ∣ A x ] = P ( B 1 ∣ A x ) × P ( B 2 ∣ A x ) × . . . P ( B i ∣ A x ) P[(B_1, B_2, ...B_i)|A_x]=P(B_1|A_x)×P(B_2|A_x)×...P(B_i|A_x) P[(B1,B2,...Bi)Ax]=P(B1Ax)×P(B2Ax)×...P(BiAx)

  2. 如果 B 1 , B 2 , . . . B i B_1, B_2, ...B_i B1,B2,...Bi之间相关,则

    P [ ( B 1 , B 2 , . . . B i ) ∣ A x ≠ P ( B 1 ∣ A x ) × P ( B 2 ∣ A x ) × . . . P ( B i ∣ A x ) P[(B_1, B_2, ...B_i)|A_x≠P(B_1|A_x)×P(B_2|A_x)×...P(B_i|A_x) P[(B1,B2,...Bi)Ax=P(B1Ax)×P(B2Ax)×...P(BiAx)

二、应用场景

1、机器翻译

在这里插入图片描述

2、拼写纠错

在这里插入图片描述

3、语音识别

在这里插入图片描述

4、密码破解

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/u013250861/article/details/113732880