pytorch损失函数binary_cross_entropy和binary_cross_entropy_with_logits的区别 - 代码天地

pytorch损失函数binary_cross_entropy和binary_cross_entropy_with_logits的区别

其他 2021-11-27 13:29:42 阅读次数: 0

binary_cross_entropy和binary_cross_entropy_with_logits都是来自torch.nn.functional的函数，首先对比官方文档对它们的区别：
在这里插入图片描述
区别只在于这个logits，那么这个logits是什么意思呢？以下是从网络上找到的一个答案：

有一个（类）损失函数名字中带了with_logits. 而这里的logits指的是,该损失函数已经内部自带了计算logit的操作，无需在传入给这个loss函数之前手动使用sigmoid/softmax将之前网络的输入映射到[0,1]之间

再看看官方给的示例代码：
binary_cross_entropy：

input = torch.randn((3, 2), requires_grad=True)
target = torch.rand((3, 2), requires_grad=False)
loss = F.binary_cross_entropy(F.sigmoid(input), target)
loss.backward()
# input is  tensor([[-0.5474,  0.2197],
#         [-0.1033, -1.3856],
#         [-0.2582, -0.1918]], requires_grad=True)
# target is  tensor([[0.7867, 0.5643],
#         [0.2240, 0.8263],
#         [0.3244, 0.2778]])
# loss is  tensor(0.8196, grad_fn=<BinaryCrossEntropyBackward>)

binary_cross_entropy_with_logits：

input = torch.randn(3, requires_grad=True)
target = torch.empty(3).random_(2)
loss = F.binary_cross_entropy_with_logits(input, target)
loss.backward()
# input is  tensor([ 1.3210, -0.0636,  0.8165], requires_grad=True)
# target is  tensor([0., 1., 1.])
# loss is  tensor(0.8830, grad_fn=<BinaryCrossEntropyWithLogitsBackward>)

的确binary_cross_entropy_with_logits不需要sigmoid函数了。

事实上，官方是推荐使用函数带有with_logits的，解释是
This loss combines a Sigmoid layer and the BCELoss in one single class. This version is more numerically stable than using a plain Sigmoid followed by a BCELoss as, by combining the operations into one layer, we take advantage of the log-sum-exp trick for numerical stability.

翻译一下就是说将sigmoid层和binaray_cross_entropy合在一起计算比分开依次计算有更好的数值稳定性，这主要是运用了log-sum-exp技巧。

那么这个log-sum-exp主要就是讲如何防止数值计算溢出的问题：
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_35037684/article/details/120698245

pytorch损失函数binary_cross_entropy和binary_cross_entropy_with_logits的区别

损失函数softmax_cross_entropy、binary_cross_entropy、sigmoid_cross_entropy之间的区别与联系

tensorflow损失函数之：softmax_cross_entropy_with_logits和softmax_cross_entropy_with_logits_v2的区别

torch.nn.functional.binary_cross_entropy_with_logits

tf.nn.softmax_cross_entropy_with_logits()及tf.nn.sparse_softmax_cross_entropy_with_logits()函数的区别

tensorflow中tf.nn.softmax_cross_entropy_with_logits和tf.nn.sparse_softmax_cross_entropy_with_logits区别

tf.nn.sparse_softmax_cross_entropy_with_logits和tf.nn.softmax_cross_entropy_with_logits区别（转载）

[tensorflow]sparse_softmax_cross_entropy_with_logits 与 softmax_cross_entropy_with_logits的区别

[TensorFlow] argmax, softmax_cross_entropy_with_logits, sparse_softmax_cross_entropy_with_logits函数详解

softmax_cross_entropy_with_logits

探究binary cross entropy的计算细节

【笔记】BCE Loss:Binary Cross Entropy

【TensorFlow】sparse_softmax_cross_entropy_with_logits 和softmax_cross_entropy_with_logits选用技巧

机器学习 - 损失计算-softmax_cross_entropy_with_logits

叉熵损失函数(Cross Entropy)

叉熵损失函数(Cross Entropy)

损失函数理解：MSE和 Cross Entropy Error

tensorflow API:tf.nn.softmax_cross_entropy_with_logits()等各种损失函数

Pytorch - Cross Entropy Loss

softmax_cross_entropy_with_logits & sparse_softmax_cross_entropy_with_logit区别

PyTorch中F.cross_entropy()函数

[pytorch]关于cross_entropy函数

cross-entropy函数

tensorflow sigmoid_cross_entropy_with_logits 函数解释

tf.nn.sparse_softmax_cross_entropy_with_logits()函数的用法

tensorflow sigmoid_cross_entropy_with_logits 函数解释及公式推导

关于tensorflow中的softmax_cross_entropy_with_logits_v2函数的区别

tf.nn.sparse_softmax_cross_entropy_with_logits 和 tf.nn.softmax_cross_entropy_with_logits分析

tf.nn.sigmoid_cross_entropy_with_logits()

tf.nn.softmax_cross_entropy_with_logits

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)