交叉熵概念整理

网上写得实在是太乱,整理下:

交叉熵函数:
H ( p , q ) = E p [ l o g   q ] = x χ p ( x ) l o g   q ( x ) H(p,q)=E_p[-log\ q]=-\sum_{x\in \chi}p(x)log\ q(x)
x x 是某个类别
χ \chi 是所有的类别的集合

H ( p , q ) = H ( p ) + D K L ( p q ) H(p,q)=H(p)+D_{KL}(p||q)
其中
D K L ( p q ) = x χ p ( x ) l o g p ( x ) q ( x ) D_{KL}(p||q)=\sum_{x\in \chi}p(x)·log\frac{p(x)}{q(x)}

交叉熵损失函数:
L ( w ) = 1 N n = 1 N H ( p n , q n ) L(w)=\frac{1}{N}\sum_{n=1}^NH(p_n,q_n)
= 1 N n = 1 N [ p n l o g   q n + ( 1 p n ) l o g ( 1 q n ) ] =-\frac{1}{N}\sum_{n=1}^N[p_nlog\ q_n+(1-p_n)log(1-q_n)]
q n = 1 1 + e w x n q_n=\frac{1}{1+e^{-w·x_n}}
w w 指的是该隐藏单元的输入权重,
x n x_n 指的是与隐藏单元链接的输入值
从定义可以看到,交叉熵损失函数的值总是小于1的。

参考链接:
https://www.cnblogs.com/ljy2013/p/6432269.html#commentform

猜你喜欢

转载自blog.csdn.net/appleyuchi/article/details/86497288
今日推荐