模型:
Softmax:
如果直接使用输出层的结果导致两个问题:
1、由于输出层的输出值的范围不确定,我们难以直观上判断这些值的意义
2、由于真实标签是离散值,这些离散值与不确定范围的输出值之间的误差难以衡量
通过下式将输出值变换成值为正且和为1的概率分布:
并且,
以上最终的矢量表达式为:
交叉熵损失函数:
模型:
Softmax:
如果直接使用输出层的结果导致两个问题:
1、由于输出层的输出值的范围不确定,我们难以直观上判断这些值的意义
2、由于真实标签是离散值,这些离散值与不确定范围的输出值之间的误差难以衡量
通过下式将输出值变换成值为正且和为1的概率分布:
并且,
以上最终的矢量表达式为:
交叉熵损失函数: