label smooth/mixup——深度学习中的一种防止过拟合方法

其他 2020-02-11 10:38:47 阅读次数: 0

Label Smooth

在常见的多分类问题中，先经过softmax处理后进行交叉熵计算，原理很简单可以将计算loss理解为，为了使得网络对测试集预测的概率分布和其真实分布接近，常用的做法是使用one-hot对真实标签进行编码，作者认为这种将标签强制one-hot的方式使网络过于自信会导致过拟合，因此软化这种编码方式。

等号左侧：是一种新的预测的分布

等号右侧：前半部分是对原分布乘一个权重， $\epsilon$ 是一个超参，需要自己设定，取值在0到1范围内。后半部分u是一个均匀分布，k表示模型的类别数。

由以上公式可以看出，这种方式使label有 $\epsilon$ 概率来自于均匀分布， $1 - \epsilon$ 概率来自于原分布。这就相当于在原label上增加噪声，让模型的预测值不要过度集中于概率较高的类别，把一些概率放在概率较低的类别。

因此，交叉熵可以替换为：

可以理解为：loss为对“预测的分布与真实分布”及“预测分布与先验分布（均匀分布）”的惩罚。

Mixup

mixup是一种非常规的数据增强方法，一个和数据无关的简单数据增强原则，其以线性插值的方式来构建新的训练样本和标签。最终对标签的处理如下公式所示，这很简单但对于增强策略来说又很不一般。

公式：

扫描二维码关注公众号，回复： 9077606 查看本文章

由以上公式可以看出，同时对输入x及其对应label y做增强，对两张图片做融合，同时对他们的label做融合，其中 $\lambda$ 是一个融合比例取值范围为0到1，由beta分布（ $\alpha$ 和 $\beta$ 计算时相等，即都取 $\alpha$ ）计算得到。

需要注意的是，yi，yj都是one-hot编码的label。

Reference

label smooth、mixup理解

深度学习 | 训练网络trick——mixup

一枚小码农

发布了74 篇原创文章 · 获赞 17 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/sinat_25394043/article/details/104256828

label smooth/mixup——深度学习中的一种防止过拟合方法

label smooth

pytorch: Label Smooth

label添加中划线

HTML中的label标签

html中label使用

label标签中for的使用

label在pictureBox中透明

kubernets中的label（标签）

HTML学习——label标签

label

label smooth标签平滑的理解

label smooth方法论文调研

Label Smoothing 标签平滑 (Label smooth regularization, LSR)

label 阻止冒泡防止点击label 触发2次事件

label标签的2种用法

Tkinter 组件详解（一）：Label Tkinter 组件详解（一）：Label

多标签学习Multi-Label Learning by Exploiting Label Dependency

[ios](归纳）label常用方法

正则化方法Label Smoothing

UIButton中的UIImageView和Label

详解JavaScript中的label语句

JavaScript中的label语句，及应用

form表单中的label标签

label在图片位置中的检验

Godot Engine 学习笔记 Label

Tkinter 组件详解（一）：Label

Tkinter组件详解（一）：Label

深度学习 | 训练网络trick——label smoothing

深度学习（15）——label 问题犯大忌

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)