【机器学习】SoftMax多分类---学习笔记 - 代码天地

【机器学习】SoftMax多分类---学习笔记

编程语言 2023-04-08 08:20:08 阅读次数: 0

SoftMax---学习笔记

softMax分类函数

首先给一个图，这个图比较清晰地告诉大家softmax是怎么计算的。

(图片来自网络)

定义：

给定以歌 $n \times k$ 矩阵 $W=(w_1,w_2,...,w_k)$ ,其中， $w_j\in R^n$ 为 $n \times 1$ 列向量（ $1\leq j\leq k$ ）,Softmax模型 $h_w:R^n →R^k$ 为：
$h_W(x)=(\frac{e^{<w_1,x>}}{\sum_{t=1}^{k}e^{<w_t,x>}},\frac{e^{<w_2,x>}}{\sum_{t=1}^{k}e^{<w_t,x>}},...,\frac{e^{<w_k,x>}}{\sum_{t=1}^{k}e^{<w_t,x>}})_{(样本m×k)}$

样本 $x_1$ 的softmax值为：
$h_W(x_1)=(\frac{e^{<w_1,x_1>}}{\sum_{t=1}^{k}e^{<w_t,x_1>}},\frac{e^{<w_2,x_1>}}{\sum_{t=1}^{k}e^{<w_t,x_1>}},...,\frac{e^{<w_k,x_1>}}{\sum_{t=1}^{k}e^{<w_t,x_1>}})_{(1×k)}$
且可知 $\sum_1^kh_w(x_1) = 1$

类别数k要小于特征维度n
如果类别数大于特征维度，那么就会出现过多的未知参数需要学习，导致模型过于复杂，难以训练和泛化。因此，通常是将类别数设定为特征维度的一个较小的值，以保证模型的简洁性和可行性。

softmax分类损失函数

交叉熵的理论部分在上一篇文章：Logistic回归
前面提到，在多分类问题中，我们经常使用交叉熵作为损失函数
$-\sum t_ilny_i$
其中 $t_i$ 表示真实值， $y_i$ 表示求出的softmax值。当预测第i个时，可以认为 $t_i$ =1.此时损失函数变成了 $Loss_i=-lny_i$
代入 $y_i=h_W(x_i)$ ，求梯度
$Loss_i=y_i-1$ 上面的结果表示，我们只需要正向求出 $y_i$ ，将结果减1就是反向更新的梯度，导数的计算是不是非常简单！

总结一下：

猜你喜欢

转载自blog.csdn.net/qq_25218219/article/details/130027310

【机器学习】SoftMax多分类---学习笔记

机器学习面试—多分类

机器学习自学总结笔记——多分类逻辑回归

机器学习：多分类及多标签分类

机器学习之多分类学习

机器学习 --- 多分类学习

Softmax与分类模型学习笔记

机器学习中的多分类任务详解

机器学习中的多分类任务入门

机器学习之SVM多分类

机器学习（)-多分类任务混淆矩阵

机器学习：逻辑回归、多分类问题

机器学习：多分类模型评价准则

机器学习——逻辑回归多分类

机器学习：多分类的logistic回归机器学习：多分类的logistic回归

sklearn学习笔记（3）svm多分类

吴恩达《机器学习》学习笔记八——逻辑回归（多分类）代码

softmax与多分类

超多分类的Softmax

多分类学习

【机器学习】多分类学习的拆分策略

斯坦福大学机器学习笔记——逻辑回归、高级优化以及多分类问题

机器学习笔记（六）神经网络引入及多分类问题实践

Bobo老师机器学习笔记第九课-如何处理多分类任务？

《PyTorch深度学习实践7》——MNIST数据集多分类（Softmax Classifier）

pytorch深度学习（9）：加载MNIST数据集，使用Softmax进行多分类

机器学习三(sklearn逻辑回归多分类——数字识别)

【机器学习】SVM基本线性可分与多分类

机器学习-一对多（多分类）代码实现（matlab）

机器学习算法之SVM的多分类原理

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)