神经网络 part2 ：Softmax classifier - 代码天地

神经网络 part2 ：Softmax classifier

其他 2018-07-03 16:52:11 阅读次数: 0

转载自皓月如我的CSDN博客，原始链接地址。 http://blog.csdn.net/fm0517/article/details/52051198

*此系列为斯坦福李飞飞团队的系列公开课“cs231n convolutional neural network for visual recognition ”的学习笔记。本文主要是对module 1 的part2 Linear classification: Support Vector Machine, Softmax 的翻译与学习。

    Softmax classifier是另一种常用的分类器，它可以看作是二类罗杰斯特回归对于多种分类情况的推广。在Softmax classifier中，判别函数与SVM一致，但是损失函数被重新定义为：

这里写图片描述
可以从信息论的角度来解读Softmax classifier:

p为正确的分类，q为算法估计出的分类。
Softmax classifier就是要缩小p，q之间的信息熵。其中q是对样本分类的估计：

这里写图片描述

p是样本的正确分类，用一个向量表示，这个向量中只有一个维度是1，其余全部都是0.

这里写图片描述
从概率的角度来解读：

上式表示在W的条件下，对输入Xi进行分类，Xi属于第yi类的概率。对于正确的分类，我们要尽力缩小否定的可能性（minimizing the negative log likelihood of the correct class），我们可以用极大似然估计来解决这个问题。也可以用极大后验概率估计（Maximum a posteriori (MAP) ）来解决这个问题。

数据稳定性
这里写图片描述
C是一个常熟，它的选取通常遵循准则：

svm vs softmax
这里写图片描述

SVM与softmax的具体操作过程如上图所示，值得注意的是，最后得到的损失函数并不具备可比性。只有用相同的分类器得到的损失函数才具备可比性。
softmax为图片是否属于某个类别提供了一个“概率”。之所以打引号，是因为进过softmax对判别函数的处理后，所有判别的得分之和是1。例如：

这里写图片描述

如果将W整体拉伸，缩小一倍。判别的结果将变为：

可以看出，“概率”的分布更加分散了。

实践中，SVM和softmax常常的性能常常不相上下。差别微乎其微。

这里写图片描述

猜你喜欢

转载自blog.csdn.net/tommorrow12/article/details/79649646

神经网络 part2 ：Softmax classifier

lab-06-2-softmax_zoo_classifier

（译）神经网络基础（2）：Softmax 分类函数

PyTorch Lecture 09: Softmax Classifier

损失函数(SVM && Softmax Classifier)

Softmax Classifier 多分类问题

[DeeplearningAI笔记]序列模型2.6Word2Vec/Skip-grams/hierarchical softmax classifier 分级softmax 分类器

lab-06-1-softmax_classifier

初学日2-激活函数-softmax函数-rnn循环神经网络

人工神经网络—Softmax分类器

卷积神经网络之SoftMax函数

神经网络全连接层+softmax:

闲谈神经网络softmax激活函数

神经网络学习引入-邻近算法Nearest Neighbor Classifier

CS231n李飞飞计算机视觉神经网络训练细节part2下

CS231n李飞飞计算机视觉神经网络训练细节part2上

cs231n assignment1 Softmax classifier

卷积神经网络softmax，cross entropy，反向求导

TF随笔-多分类单层神经网络softmax

深度学习-基于softmax神经网络分类的源码实现

神经网络（二）：Softmax函数与多元逻辑回归

TensorFlow-多分类单层神经网络softmax

TensorFlow随笔-多分类单层神经网络softmax

python-基于softmax方法的简单神经网络（程序）

softmax、softmax loss、cross entropy 卷积神经网络系列之softmax，softmax loss和cross entropy的讲解

快速了解时间敏感网络(TSN)_Part2

Java网络通信Part2：TCP通信及Socket

计算机网络 part2

神经网络_2

神经网络（2）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)