Softmax输出层损失函数及偏导数

softmax输出层(m个输入,n个输出):
Z=WX+B
(其中W为系数矩阵( n×m ),B为n维偏置量,X为m维输入向量,Z为n维向量)
yj=ezjmj=1ezj
j[1,n]
如果使用最小平方和loss函数:
E=nj=112(yjYj)2
偏导数为:
yizi=yi(1{i=j}yj)
Ezi=nj=1σyjyizi=nj=1σyjyi(1{i=j}yj)

如果使用softmax交叉熵loss函数:
E=nj=1Yjlogyj
求偏导数:
Ezi=nj=1Eyjyjzi=σyj=yiYi

猜你喜欢

转载自blog.csdn.net/templarzq/article/details/54171225