Softmax Regression - 代码天地

Softmax Regression

编程语言 2018-05-26 06:57:26 阅读次数: 0

Logistic Regression 常用于 二分类 的场合，而 Softmax Regression (又名 Multinomial Logistic Regression) 就是 Logistic Regression 在 多类别 场合下的推广，这种推广并不需要训练或者结合多个二分类分类器。

1. 概率估计和类别预测

基本思路：对某一样本/实例 $x$ ：
- 首先计算该样本属于各个类别 $k$ 的得分 $s_k(x)$ ，如 式-1 所示。
- 利用 $s_k(x)$ 和 softmax 函数 (又名 normalized exponential) 估计属于各个类别的概率，如 式-2 所示。

【式-1】类别 $k$ 的 Softmax 得分

s_{k} (x) = θ_{k}^{T} \cdot x

$s_k(x)=\theta_k^T\cdot x$

注意：每个类别都有自己专门的参数向量 $\theta_k$ ，对应于参数矩阵 $\Theta$ 中的某一行。

【式-2】利用 Softmax 函数估计样本属于类别 $k$ 的概率 (multiclass, not multioutput)

{\hat{p}}_{k} = σ (s (x))_{k} = \frac{\exp (s_{k} (x))}{\sum_{j = 1}^{K} \exp (s_{j} (x))}

$\hat{p}_k = \sigma(s(x))_k = \frac{\exp\left(s_k(x)\right)}{\sum_{j=1}^K\exp\left(s_j(x)\right)}$

$K$ 是总的类别数

【式-3】Softmax Regression 类别预测

\hat{y} = \arg max_{k} σ (s (x))_{k} = \arg max_{k} s_{k} (x) = \arg max_{k} (θ_{k}^{T} \cdot x)

$\hat{y} = \arg\max_{k}\sigma(s(x))_k = \arg\max_k s_k(x) = \arg\max_k \left( \theta_k^T\cdot x \right)$

2. 模型训练与代价函数

在多类别的条件下，模型估计的与目标类别相对应的概率值应最大，而其他类别的概率应尽可能小。因此有如 式-4 所示的 交叉熵代价函数 (cross entropy)。

交叉熵：通常用于衡量一组估计的类别概率与目标类别之间的差异性。

【式-4】交叉熵代价函数

J (Θ) = - \frac{1}{m} \sum_{i = 1}^{m} \sum_{k = 1}^{K} y_{k}^{(i)} \log ({\hat{p}}_{k}^{(i)})

$J(\Theta) = -\frac{1}{m}\sum_{i=1}^m\sum_{k=1}^Ky_k^{(i)}\log \left( \hat{p}_k^{(i)} \right)$

$y_k^{(i)}$ ：若第 $i$ 个样本属于第 $k$ 类则取 1，否则取 0.
若只有两个类别，则退化为 Logistic Regression 的代价函数 (log loss)

【式-5】类别 $k$ 的交叉熵梯度向量

\nabla_{θ_{k}} (Θ) = \frac{1}{m} \sum_{i = 1}^{m} ({\hat{p}}_{k}^{(i)} - y_{k}^{(i)}) x^{(i)}

$\nabla_{\theta_k}(\Theta) = \frac{1}{m}\sum_{i=1}^m \left( \hat{p}_k^{(i)}-y_k^{(i)}\right) x^{(i)}$

在得到 式-5 的结果后，就可以用 GD 或其他优化算法来找到使得 cost function 取得最小的 $\Theta$ 。

猜你喜欢

转载自blog.csdn.net/tsinghuahui/article/details/80377047

Softmax Regression

Softmax回归 — Softmax Regression

logistic regression and softmax_regression

2.1、Softmax Regression模型

TensorFlow(2)Softmax Regression

[实践篇] Softmax Regression

TensorFlow实践——Softmax Regression

Softmax Regression简介

3.4_softmax-regression

Ufldl Exercise:Softmax Regression Softmax回归练习

MNIST和softmax回归(softmax regression)

2.2、Softmax Regression算法实践

UFLDL Tutorial-Softmax Regression

TensorFlow入门-MNIST & softmax regression

3.7_softmax-regression-pytorch

3.6_softmax-regression-scratch

TensorFlow 实现Softmax Regression 识别数字

Tensorflow - Implement for a Softmax Regression Model on MNIST.

吴恩达——机器学习( Softmax Regression)

mxnet实现softmax regression（多层感知机）

Deep learning：十四(Softmax Regression练习)

Tensorflow学习笔记(3)-mnist(softmax regression)

简单易学的机器学习算法——Softmax Regression

tensorflow 实现softmax Regression分类器

UFLDL练习 PCA and Whitening Softmax Regression

几句话梳理Linear Regression、Logistics Regression、Softmax Regression之间的共性与区别

TensorFlow实战之Softmax Regression识别手写数字

LR进阶之softmax regression（含具体梯度推导）

CS229 6.9 Neurons Networks softmax regression

CS229 6.10 Neurons Networks implements of softmax regression

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)