cs231n笔记-超参数优选

其他 2019-02-26 16:27:19 阅读次数: 0

Hyperparameter Optimization

第一步

选择相当分散的数值，用几个epoch的迭代去学习。

经过几个epoch可以很好地知道哪些值好或不好，然后做出相应调整，得到一个较好的调参区间。

第二步

（或许需要较长的时间）在上一步骤得到的区间内进行进一步的精确搜索。

在训练循环中，有一个类似于寻找NaN这样的技巧，开始训练一些参数，在每个迭代或epoch观察cost，如果出现一个远大于初始cost的值，比如超过初始cost的3倍，就可以认为这不是一个正确的调参方向。

随机搜索 vs. 网格搜索

在这里插入图片描述
使用网格搜索对不同超参数进行采样，对每个超参数的一组固定值采样。

实际上，对这些值采用网格的方式采样不如用一种随机排列的方式对每个超参数在一定范围内进行随机采样。

随机采样是基于对超过一个变量的函数而言，随机更加真实的考虑。

一些技巧

Adam的参数配置： $\beta1=0.9$ ， $\beta2=0.999$ ，学习率=1e-3/5e-4
模型集成（Model Ensembles）：当我们已经很擅长优化目标函数，希望减少训练和测试之间的误差差距时，可以考虑模型集成的方法。从不同的随机初始值上训练多个不同的模型，测试时，在各个模型上运行测试数据，平均各个模型的预测结果。
Polyak平均：在训练模型的时候，对不同时刻的每个模型参数求指数衰减平均，从而得到网络训练中一个比较平滑的集成模型，之后使用这些平滑衰减的平均之后的模型参数，而不是截至某一时刻的模型参数。

猜你喜欢

转载自blog.csdn.net/AG9GgG/article/details/87860918

cs231n笔记-超参数优选

cs231n笔记

CS231n课程笔记5.4：超参数的选择&交叉验证

深度学习-超参数和交叉验证 CS231n课程笔记5.4：超参数的选择&交叉验证 CS231n作业笔记1.7：基于特征的图像分类之调参

CS231n

CS231n：

【cs231n学习笔记】——— KNN

CS231n笔记 Lecture 2

【cs231n】反向传播笔记

【cs231n】最优化笔记

【cs231n】线性分类笔记

【cs231n】图像分类笔记

CS231n assignment 代码 + 笔记

cs231n neural network 笔记

[cs231n学习笔记]

CS231n学习笔记-前言

cs231n笔记（10）--fastRCNN

CS231n 笔记说明

cs231n笔记（11）--fasterRCNN

cs231n深度学习笔记

cs231n笔记：最优化

CS231N, 学习笔记

cs231n笔记阅读

cs231n学习笔记

cs231n 2019版assignment 笔记（入门级解析，超详细）

cs231n笔记：训练过程中的数据集和参数

cs231n学习笔记-激活函数-BN-参数优化

cs231n knn

cs231n 批量归一化的参数优化

CS231n课程笔记翻译：反向传播笔记

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)