机器学习 | 为什么softmax函数需要减去一个max值 - 代码天地

机器学习 | 为什么softmax函数需要减去一个max值

其他 2020-03-18 15:58:17 阅读次数: 0

背景：在softmax函数对vector值进行计算，转换为[0, 1]区间的概率值的时候，往往会先对vector中每个元素减去一个max(vector)值。本文主要记录下对神经网络学习中，关于softmax函数计算的track背后的原因。

Softmax函数介绍
首先来看一下softmax函数的公式：

可以看到，softmax函数对vector处理的主要目的就是将vector的所有value处理到[0, 1]之间的类概率值。那么，为什么叫softmax呢？根据CS224n的说法，主要是因为softmax函数的效果是能够让vector中最大的数被取到的概率非常大，同时又不至于像max函数那么极端使得取到其他数的概率为0，所以叫softmax。
为什么要减去max
那么为什么要对每一个x减去一个max值呢？从需求上来说，如果x的值没有限制的情况下，当x线性增长，e指数函数下的x就呈现指数增长，一个较大的x（比如1000）就会导致程序的数值溢出，导致程序error。所以需求上来说，如果能够将所有的x数值控制在0及0以下，则不会出现这样的情况，这也是为什么不用min而采用max的原因。
数学上如何保证正确性？
正确性的关键就是要证明：softmax(x)=softmax(x+c)

上面就是简单的数学推导过程，不难发现，对任意常数c来说，都不会影响softmax的结果。所以只要把常数c设置为-max就可以实现上面的优化效果。

作者：AxsPlayer
链接：https://www.jianshu.com/p/afa0ac6b7201
来源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

云net

发布了296 篇原创文章 · 获赞 219 · 访问量 54万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/qq_36387683/article/details/103370489

机器学习 | 为什么softmax函数需要减去一个max值

为什么softmax函数需要减去一个max值

【机器学习】softmax函数

【机器学习】什么是机器学习？

为什么机器学习（三）—— 为什么softmax这样求导

【机器学习】softmax函数总结

机器学习基础—Softmax函数

机器学习基础—Softmax函数

机器学习- softmax激活函数

机器学习：为什么需要验证集？

【机器学习】softmax回归（一）

【机器学习】为什么机器学习模型需要对数据进行归一化？

机器学习之softmax

什么是机器学习？（一）

一、什么是机器学习？

（一）什么是机器学习

机器学习 -- 机器学习是什么？

机器学习——初识篇—什么是机器学习？

什么是机器学习？机器学习与AI的关系？

什么是机器学习？机器学习概述

机器学习笔记1（什么是机器学习）

机器学习为什么强大？

机器学习5 -- 为什么深度学习需要加深？

为什么机器可以学习（一）

机器学习 [logistic函数和softmax函数]

机器学习（5）：机器学习的一个实例

（一）机器学习和机器学习介绍

机器学习笔记一：关于机器学习

机器学习（一）：机器学习简介

机器学习系列（一）——机器学习简介

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)