[NAS]OHL-Auto-Aug - 代码天地

[NAS]OHL-Auto-Aug

其他 2020-04-04 14:39:02 阅读次数: 0

论文题目：Online Hyper-parameter Learning for Auto-Augmentation Strategy

`提出一种将自动增强问题近似为超参数的优化问题，并且动态地提升自动数据增强的策略的效果。`

主要内容：
1、提出在线超参学习方法。将每个增强策略视作一个参数概率分布
2、提出一个双层结构，允许分布参数能与网络参数一起训练
3、提出 OHL-Auto-Aug 动态的改善性能

在双层结构中，内部目标是优化vanilla train loss,即网络参数，外部目标是优化验证集的准确率，即增强策略的分布参数。两个目标同时优化，作为整体不用再retraining，计算量减少。

在内部训练，利用增强采样，使用SGD训练网络参数。
在外部训练，利用trajectory 样本，使用REINFORCE梯度，训练增强策略分布参数。
在每一步的迭代中，网络参数中高准确率将broadcasted 到trajectory samples

在这里插入图片描述

`Problem Formulation`

自动数据增强到策略是自动的找到一个增强操作集，增加模型的泛化性

将数据增强策略作为 $p_θ$ （在增强操作上的概率分布）。
假设有K的候选的增强操作, ${O_k (·)}_{k=1:K }$
每个操作被选择的概率是 $p_θ (Ok )$
网络模型 $F (·, w)$
数据增强的目标是：对于 $θ$ ，最大化验证集的 $acc$ ；对于模型权重 $w$ ，最小化训练 $loss$ 。

在外层，在获得最好的model $F(·,w∗)$ ,性能之下，我们寻找参数 $θ$ 。其中 $w*$ 是内层问题的解。

$T = 1, 2, ...T_{max}$ 表示外层更新迭代的steps
-$ i = 1, 2, …, I$表示内层更新迭代的steps
外层优化更新一次，内部训练更新 $I$ 个steps
trajectory ，在T周期中所以的aug操作

`对于内层的训练`

`对于外层的训练`

基于REINFORCE 算法，Monte-Carlo 采样,解决外层训练优化问题

认为 $w_T$ 仅与trajectory T 有关
内部训练，N个网络同时训练， N 个采样 trajectories. $T_n$ is the n-th trajectory.

`候选操作`

`算法流程`

关键点：
1、将aug看出概率分布，避免采样
2、N个模型，选择最好的 $w_t$ broadcast
3、优化θ，最大化验证集 $acc$ 转换公式

Schnee_y

发布了46 篇原创文章 · 获赞 15 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/sinat_34686158/article/details/105196664

[NAS]OHL-Auto-Aug

NAS

nas?

单机玩转神经网络架构搜索(NAS) - Auto-Keras学习笔记

Aug.2019_Memory

auto

TIME-Aug. & Sep.

比赛-模拟赛 (Aug 18, 2018)

NAS介绍

【NAS介绍】

NAS简介

ubuntu nas

什么是NAS

synology nas

AutoML与NAS

DAS、NAS

比赛-ZR DAY4 (07 Aug, 2018)

比赛-ZR DAY2 (05 Aug, 2018)

比赛-CioCio学长的训练赛 (Aug 18, 2018)

比赛-thh学长的训练赛 (Aug 16, 2018)

UCF “Practice” Local Contest — Aug 25, 2018 Rummy Score

AUTO Uninstaller

Auto login

Auto Layout

Auto布局

auto的用法

Eco Auto

auto for nullptr

关于 auto

auto的问题

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)