机器学习与深度学习系列连载：第二部分深度学习（十七）深度神经网络调参之道（learn to learn）

编程语言 2018-11-12 09:30:45 阅读次数: 0

深度神经网络调参之道（learn to learn）

学习Deep learning 除了算法理解、代码练习、比赛强化之外，还有一个非常重要的环节**“超参数调参”**，在漫漫参数集中如何找到心仪的参数呢？下面我为大家总结一下调参之道。
首先先看看Deep learning从业者在大家心中的位置，就知道调参工作有多重要了！
在这里插入图片描述

1. Grid Search

如此之多的参数，我该何去何从，如何用最短时间内，尝试最多的参数集
在这里插入图片描述
假设：我们从参数集合中挑选top K 个结果就已经包含大多数组合
那么根据概率论：
如果存在 N 个点, K/N 是你的样本概率在 top K中：
抽样x次（选择的次数），我们有：

所以在1000个样本中，我们选择230次就可以选到top 10的结果，仅仅选择22次就可以选择到top100的结果。

2. Model-based Hyperparameter Optimization

接下来，我们就开始用机器学习来进行超参数选择，按照惯例，我们建立一个模型来预测超参数。

在这里插入图片描述
其中蓝色区域是可能的置信区间（confidence），绿色线条是我们的acquisition函数（寻找参数的模型）我们的目的是找到一个模型，能够使confidence减小，结果变好。

3. 强化学习 reinforcement learning

这么多参数组合，手工一个一个试，确实费事费力。强化学习是一个重要的工具（我们后续专栏里面会仔细讲）。

(1) CNN 超参数的自动寻找

以CNN图片分类为例，到底每一层需要多少filter，filter的长、宽、高，通过强化学习不断地尝试，获得结果。
在这里插入图片描述

(2)learning rate 的调整

我们将操作：operatation
一元运算：unary
二元运算：binary
设定为选取的集合：在这里插入图片描述

我们的RL方法，将从这些集合中选取并组合：
在这里插入图片描述
其实最终的SGD、RMSProp、Adam 都是这些元素的组合

(3) Activation 函数的调整

我们设定一元运算、二元运算的集合：
在这里插入图片描述
于是我们有：

经过强化学习的不断选择，RL会帮我们找到计算机专家很难想到的激活函数图形

本专栏图片、公式很多来自台湾大学李弘毅老师、斯坦福大学cs229，斯坦福大学cs231n 、斯坦福大学cs224n课程。在这里，感谢这些经典课程，向他们致敬！

猜你喜欢

转载自blog.csdn.net/dukuku5038/article/details/83979866

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)