深度学习优化方法

其他 2018-09-16 01:28:02 阅读次数: 0

SGD:

优点:

算法收敛速度快(在Batch Gradient Descent算法中, 每轮会计算很多相似样本的梯度, 这部分是冗余的)
可以在线更新
有几率跳出一个比较差的局部最优而收敛到一个更好的局部最优甚至是全局最优

缺点:

容易收敛到局部最优，并且容易被困在鞍点

Momentum:

Momentum算法借用了物理中的动量概念，它模拟的是物体运动时的惯性，即更新的时候在一定程度上保留之前更新的方向，同时利用当前batch的梯度微调最终的更新方向。这样一来，可以在一定程度上增加稳定性，从而学习地更快，并且还有一定摆脱局部最优的能力.

Adagrad

上述方法中，对于每一个参数θi 的训练都使用了相同的学习率α。Adagrad算法能够在训练中自动的对learning rate进行调整，对于出现频率较低参数采用较大的α更新；相反，对于出现频率较高的参数采用较小的α更新。

Adagrad的缺点是在训练的中后期，分母上梯度平方的累加将会越来越大，从而梯度趋近于0，使得训练提前结束。

Adam

它利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。Adam的优点主要在于经过偏置校正后，每一次迭代学习率都有个确定范围，使得参数比较平稳。

所以在实际应用中，Adam为最常用的方法，可以比较快地得到一个预估结果。

一开始我使用Adam让其快速下降，最后的几个epoch使用SGD微调，这样比从头使用Adam一路到底效果要好一些。

猜你喜欢

转载自blog.csdn.net/nathan1025/article/details/82622176

深度学习——优化方法

深度学习优化方法

深度学习中的优化方法

深度学习优化方法-AdaGrad

深度学习常用优化方法

【显存优化】深度学习显存优化方法

深度学习优化方法及深度学习框架简介

深度学习记录（4） - 深度学习网络的优化方法

深度学习中各种优化方法详解

深度学习中常用的优化方法

深度学习caffe:最优化方法

浅析深度学习中优化方法

【深度学习】神经网络的优化方法

深度学习模型中的优化方法

深度学习优化方法-AdaGrad 梯度下降

神经网络：深度学习优化方法

深度神经网络——深度学习的优化方法

深度学习和机器学习最优化方法总结

深度学习手记（五）之优化方法

一文看懂深度学习优化方法——梯度下降

一文简述深度学习优化方法——梯度下降

深度学习最全优化方法总结比较及在tensorflow实现

深度学习剖根问底：最优化方法总结

深度学习系列专题之优化方法（1）

10.关于深度学习中的各种优化方法：

深度学习之激活函数、优化方法和正则化

深度学习中常见的参数优化方法

深度学习日常发问（一）：优化方法之间的对比

深度学习_GAN_GAN优化方法汇总

深度学习花书- 4.3 基于梯度的优化方法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)