深度学习理论——随机梯度下降法(SGD) && 反向传播 - 代码天地

深度学习理论——随机梯度下降法(SGD) && 反向传播

其他 2018-07-04 19:38:14 阅读次数: 0

大家好，一直在用深度学习，但是感觉理论并不扎实，打算开始补点理论基础，在CSDN上记录下来。

今天介绍随机梯度下降法和反向传播，首先介绍梯度下降法。

1.梯度下降法

梯度下降法是从初始值开始，向函数上当前点对应梯度的反方向的规定步长的距离点进行迭代搜索，最终得到最小值的过程。公式简易推导如下：

更直观的图像表示如图所示：

这是学习率为0.001，迭代两百次的示意图，当学习率设的更大，可能会迭代收敛更快，但也可能会直接越过这个最小值导致发散。

2.随机梯度下降法

梯度下降法虽然有效，但是每次迭代都要对所有样本进行计算，当样本量很大的时候，收敛速度很慢。在此基础上提出的随机梯度下降法每次只考虑一个样本，这使得他每次迭代方向不一定都是模型整体最优化的方向，因此，在深度学习中，仍然需要遍历所有样本，每遍历一遍我们称为一轮(epoch)。在此基础上我们又做了改进，改为每次选取一批样本进行计算，利用这批样本的梯度信息完成一次模型更新。这一批数据我们称为一个batch。这样有效的提高了收敛效率也避免了模型陷入局部最优。

3.反向传播

我之前一直不太了解反向传播的具体步骤，现在来简单说一下，在前向传播至最后一层得到损失函数z以后，用这个损失函数z对本层的w和x求偏导。上一层的w等于上一层的w-学习率*z对本层w的偏导，以此来更新模型，直到更新到最后一层完成一轮。而z对x的偏导是用来向前传递误差的，后面的层再根据这个误差来更新w。具体公式就不贴了，在很多地方可以找到。

好了，我们下期见！

猜你喜欢

转载自blog.csdn.net/miss_yuki/article/details/80618813

深度学习理论——随机梯度下降法(SGD) && 反向传播

梯度下降与反向传播

深度学习---梯度下降&反向传播

反向传播之梯度下降法

【转】梯度下降法与反向传播

从零学习误差反向传播(梯度下降法)

深度学习-反向传播

梯度下降和反向传播

从梯度下降到反向传播

反向传播与梯度下降的疑问

深度学习（四）之反向传播与梯度下降（公式推导）

（三）PyTorch深度学习：反向传播梯度下降

学习反向传播算法

SGD 讲解，梯度下降的做法，随机性。理解反向传播

如何理解“梯度下降法”？什么是“反向传播”？

深度学习-正向传播&反向传播

优化器：SGD优化器(随机梯度下降)、Adadelta优化器(自适应调节学习率)。反向传播：梯度下降算法(BP算法)。

深度学习 — 反向传播(BP)理论推导

深度学习—反向传播的理解

深度学习之反向传播

深度学习——DNN反向传播

深度学习反向传播的理解

深度学习之——反向传播

深度学习入门—反向传播

机器学习----PyTorch正向传播与反向传播

反向传播和梯度消失

mxnet随笔-梯度与反向传播

mxnet-梯度与反向传播

pytorch梯度累加反向传播

反向传播与梯度下降的基本概念

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)