Label Smoothing的个人看法 - 代码天地

Label Smoothing的个人看法

其他 2021-03-21 18:26:30 阅读次数: 0

看了CVPR2019得一篇论文《Bag of Tricks for Image Classification with Convolutional Neural Networks》

里面有个Label Smoothing的概念引起了自己的注意

这个观点是Inception-v2《Rethinking the Inception Architecture for Computer Vision》提到的，用来处理过拟合。

为什么我们使用softmaxloss来学习特征回过拟合，其实我们看过手写字体识别的softmax输出就能发现，

输出是很精确的：（0，0，0，0，0.99999，0，0，0，0，0.00001），如果是输入类，则对应神经元输出直接为1。

我们可以认为这是网络识别得很到位，也可以认为网络识别的很不人性，例如：1和7，6和9，存在视觉上的相似，严格的硬要区分开，是存在过拟合的隐患。

为什么对这个概念感兴趣，因为前段时间看了一部电影《美丽心灵》，说纳什的，纳什是谁，博弈论里面纳什均衡的提出者。

纳什均衡说得啥：个人利益的最大化，不一定是团体利益的最大化，但个人为了最大化自己的利益，不会改变自己的决策，这就平衡了，但这种平衡并不是最好的。

反思手写字体识别这10个输出神经元，是不是有点这种意思。

所以Szegedy在论文中说：... Intuitively, this happens because the model becomes too confident about its predictions.

个人感觉这是监督学习中的一个弊端，因为人类给机器的信号，并不够人类自己知道的多，然后人类又不知道自己知道啥，索性让机器自己学习，便会出现过拟合的情况。

猜你喜欢

转载自blog.csdn.net/XLcaoyi/article/details/93611373

Label Smoothing的个人看法

标签平滑(label smoothing)

标签平滑Label Smoothing

InceptionV3----Label Smoothing

【Network】优化问题——Label Smoothing

模型训练技巧——label smoothing

【正则化】Label Smoothing详解

标签平滑（Label Smoothing）详解

正则化方法Label Smoothing

Label Smoothing 标签平滑 (Label smooth regularization, LSR)

深度学习 | 训练网络trick——label smoothing

标签平滑：When Does Label Smoothing Help？

label

softmax求导、cross-entropy求导及label smoothing

深度学习面试题28：标签平滑(Label smoothing)

[pytorch] 图像识别之label smoothing (+mixup/cutmix)

损失函数：交叉熵 & Label Smoothing标签平滑

Inception V2/V3里的Label Smoothing

Label Smoothing是提高模型精度的一种手段

【CrossEntropyLoss】TypeError: __init__() got an unexpected keyword argument ‘label_smoothing‘

深度学习 | 训练网络trick——label smoothing(附代码)https://blog.csdn.net/qiu931110/article/details/86684241 深度学习 | 训练网络trick——label smoothing(附代码)

java label

<label>标签

label标签

label语句

label使用

浮动的label

Label propagation

标签 label

Label组件

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)