机器学习(二)线性模型---LR

机器学习(二)线性模型—LR

2.2 LR
  2.2.1 基础
  LR是一种二分类模型,属于线性模型的一种,是广义线性分类模型,采用极大似然估计,具有概率可解释性
  条件概率:

(14) P ( y = 1 | x ) = σ ( w x )

(15) P ( y = 0 | x ) = 1 σ ( w x )

  Logits/log odds,一件事发生与不发生的比率:
(16) l o g p 1 p

  2.2.2 推导:
  似然函数:
(17) i = 1 N σ ( w x i ) y i ( 1 σ ( w x i ) ) 1 y i

  对数似然函数:
(18) i = 1 N y i l o g σ ( w x i ) + ( 1 y i ) l o g ( 1 σ ( w x i ) )

  首先令 w x i + b = a
(19) d l o s s = i = 1 N y i σ ( a ) σ ( a ) d a ( 1 y i ) σ ( a ) 1 σ ( a ) d a

(20) d a = d w T x i = t r ( x i T d w )

  将 ( 20 ) σ ( a ) = σ ( a ) ( 1 σ ( a ) ) 带入 ( 19 )
d l o s s = t r ( i = 1 N y i ( 1 σ ( a ) ) x i T d w ( 1 y i ) σ ( a ) x i T d w ) (21) = t r ( i = 1 N ( y i σ ( a ) ) x i T d w )

 故:
(22) l o s s w = i = 1 N x i ( y i σ ( a ) ) = i = 1 N ( y i σ ( a ) ) x i

  2.2.3 softmax多分类推导:
  损失函数:

(23) l o s s = i = 1 N y i T l o g s o f t m a x ( W x i )

  其中:
y i k × 1 向量,只有一个位置为1表示类别
W k × d 权矩阵,d为特征的维度
s o f t m a x ( a ) 为逐元素函数
 令:
(24) a i = W x i

 将 ( 24 ) ( 23 ) :
d l o s s = i = 1 N y i T d l o g s o f t m a x ( a i ) = i = 1 N y i T d l o g ( e a i 1 T e a i ) = i = 1 N y i T ( d a i 1 d l o g ( 1 T e a i ) ) = i = 1 N ( y i T d a i d l o g ( 1 T e a i ) ) = i = 1 N ( y i T d a i 1 T 1 T e a i d e a i ) = i = 1 N ( y i T d a i 1 T ( e a i d a i ) 1 T e a i ) = i = 1 N ( y i T d a i ( e a i ) T d a i 1 T e a i ) = t r ( i = 1 N ( e a i ) T d a i 1 T e a i y i T d a i ) = t r ( i = 1 N s o f t m a x ( a i ) T   d a i y i T d a i ) = t r ( i = 1 N ( s o f t m a x ( a i ) T   y i T ) d W x i ) (25) = t r ( i = 1 N x i ( s o f t m a x ( a i )   y i ) d W )

  固:
(26) l o s s W = i = 1 N ( s o f t m a x ( W x i ) y i ) x i T

 2.2.4 相关问题总结

  • Sigmoid变化的理解?
    a) sigmoid函数光滑,处处可导,导数还能用自己表示
    b) sigmoid能把数据从负无穷到正无穷压缩到0,1之间,压缩掉了长尾,扩展了核心分辨率。
    c) sigmoid在有观测误差的情况下最优的保证了输入信号的信息。

  • LR有什么特点?
    简单 容易欠拟合 对几率w*x+b 线性的 实际问题不能完全用线性来拟合
    各feature之间不需要满足条件独立假设,但各个feature的贡献独立计算

  • 如何用LR建立一个广告点击的模型?
    特征提取—>特征处理(离散化、归一化、onehot特征交叉、特征选择等)—>找出候选集—->模型训练,得到结果

猜你喜欢

转载自blog.csdn.net/dynomite/article/details/80868445