机器学习(概率论)

概率论

  • 事件互斥
  1. 定义

事件A与事件B不可能同时发生,则A、B为互斥事件

  1. 互斥事件的并集

P ( A B ) = P ( A ) + P ( B ) P\big( A \cup B \big) = P\big(A \big) +P\big(B\big)

  • 事件独立
  1. 定义

A事件的发生对B事件的发生没有影响

  1. 独立事件的交集运算

P ( A B ) = p ( A ) ( B ) P\big( A \cap B\big)=p\big(A\big)*\big(B\big)

  • 条件概率
  1. 定义

X事件发生的情况下Y事件发生的概率

  1. 条件概率计算

P ( Y X ) = P ( X Y ) / P ( X ) P\big( Y|X\big)=P\big( XY\big)/P\big( X\big)

  • 联合概率
  1. 定义

X和Y同时发生的概率 = X先发生的概率乘以X发生的情况下Y发生的概率

  1. 表达式

P ( X Y ) = P ( X ) P ( Y X ) P\big( XY\big)=P\big(X\big)*P\big(Y|X\big)

  • 贝叶斯公式
  1. 定义

P ( X Y ) = P ( X Y ) P ( Y ) = P ( Y X ) P ( X ) P\big(XY\big)=P\big(X|Y\big)*P\big(Y\big)=P\big(Y|X\big)*P\big(X\big)

  1. 变形

P ( Y X ) = P ( X Y ) P ( Y ) / P ( X ) P\big(Y|X\big)=P\big(X|Y\big)*P\big(Y\big)/P\big(X\big)

  1. 细节解释

P ( Y X ) P\big(Y|X\big) 后验概率
P ( Y ) P\big(Y\big) 先验概率

  • 生成模型与判别模型
  1. 目标

P ( Y X ) P\big(Y|X\big)

  1. 生成模型

P ( Y X ) = P ( X Y ) P ( Y ) / P ( X ) P\big(Y|X\big)=P\big(X|Y\big)*P\big(Y\big)/P\big(X\big)

  1. 判别模型

P ( Y X ) P\big( Y|X\big)

  • 离散随机变量
  1. 伯努利分布: P ( Y = 1 ) = p = 1 P ( Y = 0 ) = 1 q P\big(Y=1\big)=p=1-P\big(Y=0\big)=1-q
  2. 多项分布:多次伯努利
  • 期望
  1. 定义

E [ X ] = x 1 p 1 + x 2 p 2 + . . . x n p n E[X]=x_1p_1+x_2p_2+...x_np_n

  1. 性质

E [ X + Y ] = E [ X ] + E [ Y ] , E [ a X ] = a E [ X ] E[X+Y]=E[X]+E[Y],E[aX]=aE[X]
如果X,Y相互独立,那么 E [ X Y ] = E [ X ] E [ Y ] E[XY]=E[X]*E[Y]

  • 方差
    假设 μ \mu 为期望, x 1 , x 2 , . . . , x n x_1,x_2,...,x_n 对应的概率为 p 1 , p 2 , . . . p n p_1,p_2,...p_n ,那么 X X 的方差(Variance)为:
  1. V a r [ X ] = ( x 1 μ ) 2 p 1 + . . . + ( x n μ ) 2 p n Var[X]=\big(x_1-\mu\big)^2p_1+...+\big(x_n-\mu\big)^2p_n
  2. V a r [ X ] = E [ ( X μ ) 2 ] Var[X]=E[\big( X-\mu\big)^2]
  3. V a r [ X ] = E [ X 2 ] E [ X ] 2 Var[X]=E[X^2]-E[X]^2
  4. 如果X和Y独立,则 V a r [ X + Y ] = V a r [ X ] + V a r [ Y ] Var[X+Y]=Var[X]+Var[Y]
  • ROC曲线(一般应用于二分类)
  1. 准确率的缺陷

如果数据Label不平衡,则最好不使用准确率
precision=TP/(TP+FP)

  1. 召回率

recall=TPR=TP/(TP+FN)
recall=FPR=FP/(FP+TN)

  1. AOC特指描述的曲线,AUC特指曲线与坐标轴构成的面积

AOC一般以FPR为横坐标,TPR为纵坐标

  • 连续随机变量
  1. 条件: f ( X ) 0 , X Ω , f ( x ) d x = 1 f\big(X\big)\geq0,X\subseteq\Omega,\int f\big(x\big)d_x=1
  2. 概率: P ( X S ) = s f ( x ) d x P\big(X\subset S\big)=\int_sf\big(x\big)d_x
  3. 期望: E [ X ] = X f ( X ) d x E[X]=\int Xf\big(X\big)d_x
  4. 方差: V a r [ X ] = ( X μ ) 2 f ( x ) d x Var[X]=\int\big(X-\mu\big)^2f\big(x\big)d_x

*正态分布

  1. 定义
    X   N ( μ , δ 2 ) , f ( X ) = 1 2 π δ 2 e x p ( 1 2 δ 2 ( x μ ) 2 ) X~N\big(\mu,\delta^2\big),f\big(X\big)=\frac{1}{\sqrt{2\pi\delta^2}}exp\big(-\frac{1}{2\delta^2}\big(x-\mu\big)^2\big)
  2. 参数
    E ( X ) = μ E\big(X\big)=\mu
    V a r [ X ] = δ 2 Var[X]=\delta^2
  • 协方差和相关系数
  1. c o v ( X , Y ) = E [ ( X E ( X ) ) ( Y E [ Y ] ) ] = E [ X Y ] E [ X ] E [ Y ] cov\big(X,Y\big)=E[\big(X-E\big(X\big)\big)\big(Y-E[Y]\big)]=E[XY]-E[X]E[Y]
  2. c o v ( X , Y ) = c o v ( X , Y ) V a r ( X ) V a r ( Y ) cov\big(X,Y\big)=\frac{cov\big(X,Y\big)}{\sqrt{Var\big(X\big)Var\big(Y\big)}}
  • 朴素贝叶斯(假设各因子间相互独立)

P ( Y X 1 , X 2 , . . . , X n ) = P ( X 1 , X 2 , . . . , X P Y ) P ( Y ) P ( X 1 , X 2 , . . . , X P ) = P ( X 1 Y ) P ( X 2 Y ) . . . P ( X P Y ) P ( Y ) P ( X 1 , X 2 , . . . . , X P ) P\big(Y|X_1,X_2,...,X_n\big)=\frac{P\big(X_1,X_2,...,X_P|Y\big)P\big(Y\big)}{P\big(X_1,X_2,...,X_P\big)}=\frac{P\big(X_1|Y\big)P\big(X_2|Y\big)...P\big(X_P|Y\big)P\big(Y\big)}{P\big(X_1,X_2,....,X_P\big)}

  1. 定义
    H ( X ) = i P ( X i ) l o g P ( X i ) H\big(X\big)=-\sum_iP\big(X_i\big)logP\big(X_i\big)
  2. 含义
    代表不确定性
  • KL DIVERGENCE
  1. 定义

给定两个概率分布p,q,定义KL Divergence为:

K L ( p q ) = i p i l o g p i q i KL\big(p||q\big)=\sum\limits_{i}p_ilog\frac{p_i}{q_i}

  • 互信息
  1. 定义

I ( X , Y ) = K L ( P ( X , Y ) P ( X ) P ( Y ) ) I\big(X,Y\big)=KL\big(P\big(X,Y\big)||P\big(X\big)P\big(Y\big)\big)

  1. 性质

I ( X , Y ) 0 I\big(X,Y\big)\geq0 当且仅当 P ( X , Y ) = P ( X ) P ( Y ) P\big(X,Y\big)=P\big(X\big)P\big(Y\big) 时, I ( X , Y ) = 0 I\big(X,Y\big)=0

I ( X , Y ) = H ( X ) H ( X Y ) I\big(X,Y\big)=H\big(X\big)-H\big(X|Y\big)

猜你喜欢

转载自blog.csdn.net/weixin_42150936/article/details/85345133
今日推荐