标签平滑(label smoothing)

其他 2020-06-22 12:06:49 阅读次数: 0

1. 什么是标签平滑？

标签平滑就是用来解决over-confident的问题，这类问题在对抗构建中尤为重要(GANs)
通俗来讲
机器学习的样本中通常会存在少量错误标签，这些错误标签会影响到预测的效果。标签平滑采用如下思路解决这个问题：在训练时即假设标签可能存在错误，避免“过分”相信训练样本的标签。当目标函数为交叉熵时，这一思想有非常简单的实现，称为标签平滑（Label Smoothing）。
我们以2类分类问题为例，此时训练样本为(xi,yi)，其中yi是样本标签，为0或1。在训练样本中，我们并不能保证所有的样本标签都标注正确，如果某个样本的标注是错误的，那么在训练时，该样本就有可能对训练结果产生负面影响。一个很自然的想法是，如果我们有办法“告诉”模型，样本的标签不一定正确，那么训练出来的模型对于少量的样本错误就会有“免疫力”。

2. 标签平滑使用的方法是什么？

2.1 理论上

**在每次迭代时，并不直接将(xi,yi)放入训练集，而是设置一个错误率ε，以1-ε的概率将(xi,yi)代入训练，以ε的概率将(xi,1-yi)代入训练。**这样，模型在训练时，既有正确标签输入，又有错误标签输入，可以想象，如此训练出来的模型不会“全力匹配”每一个标签，而只是在一定程度上匹配。这样，如果真的出现错误标签，模型受到的影响就会更小。

2.2 实际上

在这里插入图片描述

2.2.1 为什么这样做就有效

在这里插入图片描述

3. 标签平滑的作用

在几乎所有的情况下，使用标签平滑训练可以产生更好的校准网络，从而更好地去泛化网路，最终对不可见的生产数据产生更准确的预测。因此，标签平滑应该是大多数深度学习训练的一部分。

4. 在GANs中的应用

单侧标签平滑

5. 参考博客

https://www.cnblogs.com/whustczy/p/12520239.html
https://blog.csdn.net/Matrix_cc/article/details/105344967

猜你喜欢

转载自blog.csdn.net/weixin_44441131/article/details/106436808

标签平滑(label smoothing)

标签平滑Label Smoothing

标签平滑（Label Smoothing）详解

标签平滑：When Does Label Smoothing Help？

Label Smoothing 标签平滑 (Label smooth regularization, LSR)

深度学习面试题28：标签平滑(Label smoothing)

损失函数：交叉熵 & Label Smoothing标签平滑

曲线平滑(smoothing)

Label Smoothing的个人看法

InceptionV3----Label Smoothing

【Network】优化问题——Label Smoothing

模型训练技巧——label smoothing

【正则化】Label Smoothing详解

正则化方法Label Smoothing

用于缓和面部表情噪声标签（Noisy Labels）的带有软标签平滑（Soft Label Smoothing）的教师网络（Teaching Network）

文字平滑属性 font-smoothing

深度学习 | 训练网络trick——label smoothing

拉普拉斯平滑处理 Laplace Smoothing

【简单理解】自然语言处理-平滑方法(Smoothing)

softmax求导、cross-entropy求导及label smoothing

[pytorch] 图像识别之label smoothing (+mixup/cutmix)

Inception V2/V3里的Label Smoothing

label smooth标签平滑的理解

. Smoothing Images

Smoothing Images

Image Smoothing via Unsupervised Learning ---- 通过半监督学习的图像平滑

朴素贝叶斯拉普拉斯平滑（Laplace Smoothing）

[译]如何使用Python构建指数平滑模型:Simple Exponential Smoothing, Holt, and Holt-Winters

Label Smoothing是提高模型精度的一种手段

【CrossEntropyLoss】TypeError: __init__() got an unexpected keyword argument ‘label_smoothing‘

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)