tensorflow sigmoid_cross_entropy_with_logits 函数解释及公式推导 - 代码天地

tensorflow sigmoid_cross_entropy_with_logits 函数解释及公式推导

其他 2019-03-03 23:14:35 阅读次数: 0

tensorflow sigmoid_cross_entropy_with_logits 函数解释及公式推导

tensorflow官方文档解释参考

pytorch–BCELoss
pytorch–BCELoss解释参考

定义在tensorflow/python/ops/nn_impl.py.

功能：计算在给定logits和label之间的sigmoid cross
entropy。测量离散分类任务中的概率误差，其中每个类是独立的，而不是相互排斥的。
例如，可以执行多标签分类，其中图片可以同时包含大象和狗。

通俗的解释是在进行分类任务时，计算我们得到的logits值（也有说scores分数值）与期望值（类别标签）label之间的差别。

tf.nn.sigmoid_cross_entropy_with_logits(
    _sentinel=None,
    labels=None,
    logits=None,
    name=None
)

计算公式：

这就是标准的Cross Entropy算法实现，对得到的值logits进行sigmoid激活，保证取值在0到1之间，然后放在交叉熵的函数中计算Loss。

公式推导：
为了简便, 让x = logits, z = labels. 上述公式可以写为：

  z * -log(sigmoid(x)) + (1 - z) * -log(1 - sigmoid(x))
= z * -log(1 / (1 + exp(-x))) + (1 - z) * -log(exp(-x) / (1 + exp(-x)))
= z * log(1 + exp(-x)) + (1 - z) * (-log(exp(-x)) + log(1 + exp(-x)))
= z * log(1 + exp(-x)) + (1 - z) * (x + log(1 + exp(-x))
= (1 - z) * x + log(1 + exp(-x))
= x - x * z + log(1 + exp(-x))

对于x < 0，为了避免exp(-x)中的溢出，我们重新制定了上面的公式:

  x - x * z + log(1 + exp(-x))
= log(exp(x)) - x * z + log(1 + exp(-x))
= log(exp(x)) - x * z + log((1 + exp(x)) / exp(x))
= log(exp(x)) - x * z + log(1 + exp(x) - log(exp(x))
= - x * z + log(1 + exp(x))

因此，为了保证稳定性和避免溢出，实现使用了这个等价的公式

max(x, 0) - x * z + log(1 + exp(-abs(x)))

logits和labels必须具有相同的类型和形状。
参数:

sentinel: 用于防止位置参数。内部，请勿使用。
labels: 与logits相同类型和形状的张量。
logits: 浮点型张量，32或64。
name: 操作的名称(可选)。

返回值：

一种形状与logits张量相同的张量，具有分量逻辑损失。

猜你喜欢

转载自blog.csdn.net/qq_22979337/article/details/84984800

tensorflow sigmoid_cross_entropy_with_logits 函数解释及公式推导

tensorflow sigmoid_cross_entropy_with_logits 函数解释

[TensorFlow] argmax, softmax_cross_entropy_with_logits, sparse_softmax_cross_entropy_with_logits函数详解

tensorflow损失函数之：softmax_cross_entropy_with_logits和softmax_cross_entropy_with_logits_v2的区别

tensorflow API:tf.nn.softmax_cross_entropy_with_logits()等各种损失函数

tensorflow中四种不同交叉熵函数tf.nn.softmax_cross_entropy_with_logits()

tensorflow---调用tf.softmax_cross_entropy_with_logits函数出错解决

关于tensorflow中的softmax_cross_entropy_with_logits_v2函数的区别

tensorflow相关函数___tf.layers.dense(), tf.nn.softmax_cross_entropy_with_logits_v2

【TensorFlow】中tf.nn.sparse_softmax_cross_entropy_with_logits()函数讲解

Tensorflow中的四种交叉熵函数 tf.nn.softmax_cross_entropy_with_logits()

[tensorflow]sparse_softmax_cross_entropy_with_logits 与 softmax_cross_entropy_with_logits的区别

【TensorFlow】sparse_softmax_cross_entropy_with_logits 和softmax_cross_entropy_with_logits选用技巧

【TensorFlow】tf.nn.softmax_cross_entropy_with_logits的用法

【TensorFlow】关于tf.nn.sparse_softmax_cross_entropy_with_logits（）

TensorFlow tf.nn.softmax_cross_entropy_with_logits

【TensorFlow】tf.nn.softmax_cross_entropy_with_logits的用法【TensorFlow】tf.nn.softmax_cross_entropy_with_logits的用法

tensorflow中tf.nn.softmax_cross_entropy_with_logits和tf.nn.sparse_softmax_cross_entropy_with_logits区别

deep_learning_Function_softmax_cross_entropy_with_logits 【TensorFlow】tf.nn.softmax_cross_entropy_with_logits的用法

tf.nn.sigmoid_cross_entropy_with_logits()

tf.nn.sparse_softmax_cross_entropy_with_logits()函数的用法

pytorch损失函数binary_cross_entropy和binary_cross_entropy_with_logits的区别

tf.nn.softmax_cross_entropy_with_logits()及tf.nn.sparse_softmax_cross_entropy_with_logits()函数的区别

Tensorflow四种交叉熵函数计算公式：tf.nn.cross_entropy

TensorFlow基础学习——“Only call `sparse_softmax_cross_entropy_with_logits` with named arguments”错误的解决

成功解决softmax_cross_entropy_with_logits (from tensorflow.python.ops.nn_ops) is deprecated and will be

TensorFlow用softmax_cross_entropy_with_logits的loss一直增大

TensorFlow基础篇（三）——tf.nn.softmax_cross_entropy_with_logits

TensorFlow计算loss值大小，tf.nn.softmax_cross_entropy_with_logits的用法

损失函数softmax_cross_entropy、binary_cross_entropy、sigmoid_cross_entropy之间的区别与联系

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)