为什么深度网络（vgg，resnet）最后都不使用softmax（概率归一）函数，而是直接加fc层？ - 代码天地

为什么深度网络（vgg，resnet）最后都不使用softmax（概率归一）函数，而是直接加fc层？

业界资讯 2023-09-11 22:25:20 阅读次数: 0

这个问题很简单，并不是没有使用softmax，而是没有显式使用softmax。

随着深度学习框架的发展，为了更好的性能，部分框架选择了在使用交叉熵损失函数时默认加上softmax，这样无论你的输出层是什么，只要用了nn.CrossEntropyLoss就默认加上了softmax。不仅是Pytorch，国内的飞桨PaddlePaddle2.0等框架也是这样。但在更早的一些版本，默认是不隐式添加softmax的，所以会有一部分教程/资料，要求在撰写对应代码时手动添加softmax。当然，自己的框架是否需要手动在输出层添加softmax，推荐看对应的API文档。道听途说不一定可取，毕竟一个softmax可以做分类，俩softmax搞不好就不收敛了
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_43374694/article/details/132588508

为什么深度网络（vgg，resnet）最后都不使用softmax（概率归一）函数，而是直接加fc层？

Pytorch中的VGG怎么修改最后一层FC

最后一层是sigmoid或者softmax激活函数的神经网络，为什么不适合用平方误差损失函数？

对于分类问题的神经网络最后一层的函数：sigmoid、softmax与损失函数

为什么不使用github的wiki而是使用mkdocs做文档管理？

残差网络 ResNet 为什么能训练出1000层的模型动手学深度学习v2

为什么程序员都不喜欢使用switch，而是大量的 if……else if ？

深度学习经典网络 (1)，AlexNet,NIN,OverFeat,VGG,ResNet

深度学习入门（四）：经典网络架构（Alexnet、Vgg、Resnet）

直观理解神经网络最后一层全连接+Softmax

深度学习笔记之为什么是SoftMax

为什么Kafka不使用http?为什么消息中间件不直接使用http协议？

深度学习为什么使用梯度下降，而不使用不使用牛顿法或拟牛顿法优化？

在网络最后加一个训练好的mlp层并将其参数冻结

为什么神经网络需要激活函数层？

oracle为什么不使用索引

直播为什么不使用WebRTC？

vector扩容为什么不使用realloc

神经网络多分类中为什么用softmax函数归一化而不用其它归一化方法

为什么Vue 组件中的 data 不是对象而是函数？

深度学学习常用网络结构AlexNet、VGG、GoogleNet、ResNet、SENet

神经网络，深度学习，为什么要用激活函数？？？？？

深度学习之softmax函数（一）

为什么softmax函数需要减去一个max值

机器学习 | 为什么softmax函数需要减去一个max值

CNN入门讲解-为什么要有最后一层全连接？

为什么是SoftMax？

【深度学习】经典算法解读及代码复现AlexNet-VGG-GoogLeNet-ResNet(一)

为什么React中this.state不要直接修改，而是创建新的副本

java为什么不直接实现Iterator接口，而是实现Iterable

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)