Tensorflow学习二：神经网络用于分类和回归的损失函数 - 代码天地

Tensorflow学习二：神经网络用于分类和回归的损失函数

其他 2018-06-26 03:32:40 阅读次数: 4

引言：

对于二分类问题，一般会将预测结果经过一个非线性变换缩小到0到1之间，并设置一个阀值，比如0.5，小于0.5便是0，大于0.5便是1。但是这种做法对于多分类是不适用的。

交叉熵：

通过神经网络解决多分类的方法是设置n个输出节点，n代表类别数。对于每一个样例，神经网络会得到一个n维数组做为输出结果。数组中的每一个维度代表对应的类别。理想情况下，如果一个样本属于k,那么这个类别对应的输出节点的输出值应该为1.而其他节点为0.但是实际上不可能，比如我们理想的是[0, 0, 1, 0]，而实际上输出的是[0.1,0.2,0.6,0.1],那么我们这时候如何评判呢，此时交叉熵是常用的评判方法之一。交叉熵刻画得是两个概率分布之间的距离。比如上面的0和0.1的距离。1和0.6的距离。它的公式是这样的：

$H(p,q)=-\sum _{x}p(x)\,\log q(x).\!$

softmax回归：

但是还有一点要指出的是，神经网络预测的应该是一个概率，比如这种形式的[0.1,0.2,0.6,0.1]，但是可以想到最后一层的神经网络，对于每一个结点，其实输出的不会就是一个概率，使得所有输出节点的概率之和为1，那么如何得到概率向量呢？我们使用softmax回归函数。它的公式是这样的：

二分类的交叉熵：

当分类结果只有0和1时，交叉熵变成以下形式：

总结：

当交叉熵用于神经网络的损失函数时，p代表的是正确答案，q代表的是预测值，交叉熵刻画得是两个概率分布之间的距离，也就是说交叉熵越小，两个概率分布越近。

tensorflow中的实现：

cross_entropy = -tf.reduce_mean(y_*tf.log(tf.clip_by_value(y, 1e-10, 1.0)))

因为交叉熵一班会与softmax回归一起使用，所以tf有一个封装，比如可以直接通过下面的代码实现使用了softmax回归之后的交叉熵损失函数：

cross_entropy = tf.nn.softmax_cross_entropy_with_logits(y, y_)

回归问题：

与分类问题不同的是，回归问题是对具体数值的预测，要预测的是一个数字，因此解决回归问题的网络一般只有一个输出节点，这个节点的输出值就是预测值。对于回归问题，最常用的损失函数就是均方误差（MSE）函数，其在tf中实现如下：

mse = tf.reduce_mean(tf.square(y_ - y))

猜你喜欢

转载自blog.csdn.net/xckkcxxck/article/details/80030111

Tensorflow学习二：神经网络用于分类和回归的损失函数

神经网络和深度学习-第二周神经网络基础-第三节：Logistic 回归损失函数

学习《TensorFlow实战Google深度学习框架》（二）深层神经网络及损失函数

简单神经网络解决二分类问题示例（Tensorflow）（自定义损失函数）

神经网络的损失函数---学习笔记

第二周神经网络基础 2.3 logistic回归损失函数

神经网络与深度学习笔记（三）：逻辑回归的损失函数

神经网络多分类任务的损失函数——交叉熵

TensorFlow笔记之神经网络优化——损失函数

tensorflow定义神经网络损失函数MSE

神经网络的损失函数

神经网络——损失函数

神经网络-损失函数

神经网络-损失函数：

【基于tensorflow的学习】线性回归、逻辑回归、神经网络

TensorFlow笔记-06-神经网络优化-损失函数，自定义损失函数

深度神经网络之损失函数和激活函数

神经网络激活函数和损失函数

神经网络优化学习-——损失函数学习率

简单粗暴理解与实现机器学习之神经网络NN（二）：神经网络多分类原理与反向传播原理、神经网络计算输出、softmax回归、梯度下降算法、向量化编程、激活函数的选择等等

深度学习（13）神经网络中损失函数的作用

神经网络学习笔记5-损失函数

深度学习——07 快速搭建神经网络添加损失函数和优化器

神经网络基础——从二分分类和逻辑回归说起

Tensorflow学习笔记：多输入线性回归神经网络

tensorflow学习（5）- 用神经网络训练回归问题

小白玩机器学习（4） --- p5.js + tensorflow.js 使用神经网络做回归和分类

Tensorflow深度学习神经网络学习笔记（一）二分类与多分类网络

机器学习中Logistic损失函数以及神经网络损失函数详解

神经网络损失函数总结

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)