SoftMax多分类器原理及代码理解

其他 2018-05-03 14:06:45 阅读次数: 4

关于多分类

我们常见的逻辑回归、SVM等常用于解决二分类问题，对于多分类问题，比如识别手写数字，它就需要10个分类，同样也可以用逻辑回归或SVM，只是需要多个二分类来组成多分类，但这里讨论另外一种方式来解决多分类——SoftMax。

SoftMax模型

Softmax回归模型是logistic回归模型在多分类问题上的推广，当分类数为2的时候会退化为Logistic分类。.在多分类问题中，类标签 $y$ 可以取两个以上的值。 Softmax回归模型对于诸如MNIST手写数字分类等问题是很有用的，该问题的目的是辨识10个不同的单个数字。Softmax回归是有监督的。

在logistic回归中，训练集由 $m$ 个已标记的样本构成：

，，由于logistic回归是针对二分类问题的，因此类标记 $y^{(i)}\in \left\{ 0,1 \right\}$ 。

假设函数如下：

训练模型参数 $\theta$ ，使其能够最小化代价函数：

对于给定的测试输入 $x$ ，用假设函数针对每一个类别 $j$ 估算出概率值 $p(y=j|x)$ ，即，估计 $x$ 的每一种分类结果出现的概率。假设函数将要输出一个 $k$ 维的向量来表示这 $k$ 个估计的概率值。假设函数 $h_{\theta}(x)$ 形式如下：

代价函数

上述公式是logistic回归代价函数的推广。logistic回归代价函数可以改为：

Softmax代价函数与logistic 代价函数在形式上非常类似，只是在Softmax损失函数中对类标记的 $k$ 个可能值进行了累加。注意在Softmax回归中将 $x$ 分类为类别 $j$ 的概率为：

一般使用梯度下降优化算法来最小化代价函数，而其中会涉及到偏导数，即得到代价函数对参数权重的梯度就可以优化了。

例子

从下图看，神经网络中包含了输入层，然后通过两个特征层处理，最后通过softmax分析器就能得到不同条件下的概率，这里需要分成三个类别，最终会得到y=0、y=1、y=2的概率值。

继续看下面的图，三个输入通过softmax后得到一个数组[0.05 , 0.10 , 0.85]，这就是soft的功能。

计算过程直接看下图，其中

这里写图片描述

可以看到它有多个值，所有值加起来刚好等于1，每个输出都映射到了0到1区间，可以看成是概率问题。

使用场景

在多分类场景中可以用softmax也可以用多个二分类器组合成多分类，比如多个逻辑分类器或SVM分类器等等。该使用softmax还是组合分类器，主要看分类的类别是否互斥，如果互斥则用softmax，如果不是互斥的则使用组合分类器。

参考文献：

https://www.cnblogs.com/hellcat/p/7220536.html?utm_source=itdadao&utm_medium=referral

猜你喜欢

转载自www.cnblogs.com/wangyarui/p/8670769.html

SoftMax多分类器原理及代码理解

softmax与多分类

超多分类的Softmax

多分类器softmax——绝对简单易懂的梯度推导

softmax及在多分类中的应用

基于softmax的多分类模型

softmax回归（多分类问题）

softmax（多分类算法）实践

softmax多分类激活函数

Softmax Classifier 多分类问题

九、逻辑回归多分类和softmax多分类

浅谈线性多分类分类器（全连接层、SVM、Softmax classifier等）

CNN+SVM模型实现图形多分类任务（SVM替换softmax分类器）

Softmax多分类算法的最详细推荐

SoftMax实现多分类(不含隐藏层)

LR多分类推广 - Softmax回归*

逻辑回归解决多分类和softmax

逻辑回归多分类之Softmax

多分类（softmax处理iris数据集）

Softmax回归多分类网络（PyTorch实现）

TensorFlow实战之softmax多分类

【Python】逻辑回归（softmax多分类）

【机器学习】SoftMax多分类---学习笔记

python逻辑回归（logistic regression LR) 底层代码实现 BGD梯度下降算法 softmax多分类

多分类的loss函数，accuracy理解——手写代码

简单粗暴理解与实现机器学习之神经网络NN（二）：神经网络多分类原理与反向传播原理、神经网络计算输出、softmax回归、梯度下降算法、向量化编程、激活函数的选择等等

CS231对SVM及Softmax分类器的理解

多分类和多标签分类，softmax和sigmoid的用法

Softmax分类器

softmax 分类器

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)