mse与交叉熵

转载自知乎-兔子老大
https://www.zhihu.com/question/65780182/answer/299980781

损失函数什么时候用mse,什么时候用交叉熵?为什么,换过来用有什么影响吗?

第一,分类用交叉熵,回归用mse/mae,前者的假设是伯努利分布,后者假设是高斯分布。第二,即使在0-1之间连续值用sigmoid预测,也可能会造成梯度消失的问题。

猜你喜欢

转载自blog.csdn.net/haseetxwd/article/details/79364045