《动手学深度学习》学习记录02:Chapter03_2:softmax regression

模型:

  

  

Softmax:

  如果直接使用输出层的结果导致两个问题:

    1、由于输出层的输出值的范围不确定,我们难以直观上判断这些值的意义

    2、由于真实标签是离散值,这些离散值与不确定范围的输出值之间的误差难以衡量

  通过下式将输出值变换成值为正且和为1的概率分布:

  

  并且,

  

  以上最终的矢量表达式为:

  

交叉熵损失函数:

  

猜你喜欢

转载自www.cnblogs.com/RaspberryFarmer/p/11354436.html