深度学习-后向传播算法

其他 2020-02-09 15:41:46 阅读次数: 0

深度学习-后向传播算法

前向传播
为什么需要反向传播
后向传播

梯度下降[^1]
链式法则
一次前向传播[^2]
后向传播
反向传播的问题及解决方案

深度学习的第一步，一定要理解后向传播算法。

前向传播

$\frac{ ∂C }{ ∂wj }≈C(w+ϵej)−C(w)ϵ$
计算损失函数C关于每个权重wj 的梯度，都需要对于每一个样本计算损失函数C(w+ϵej) ，当网络神经元增加，权重数量增加，比如一百万个，就需要计算一百万次损失函数，计算量是惊人的。

为什么需要反向传播

高效。基本上相当于两次前向传播的计算量（详情见下面算法部分，一次前向+一次后向梯度运算）。

后向传播

反向传播涉及的基础知识点包括：梯度下降和链式法则。

梯度下降¹

一种最优化方法，按照梯度的反方向（下降最快的方向）进行迭代更新。 [这里可以进一步了解方向倒数，梯度以及最优化方法SGD, BGD, 牛顿法, 拟牛顿法(BFGS, LBFGS), Momentum, NAG, Adagrad, Rmsprop, Adadelta, Adam, NAdam等。]
在这里插入图片描述

链式法则

链式规则

一次前向传播²

一次前向传播

后向传播

后向传播更新

反向传播的问题及解决方案

梯度消失和梯度饱和、合适的学习率、批大小、epoch 数量等。
解决方案有：

激活函数方向。如relu, leaky relu, elu等
fine tuning, 预训练微调
合适的初始化。如glorot, xavier, he等
添加正则。如LN，BN，WN，CN等
梯度剪切clip
残差结构resnet，短连接
LSTM(有短连接的存在，gate不容易爆炸或消失）
使用线性后向传播³。如下图，线性反向传播算法在传递损失函数的梯度时，因为是线性函数，所以不需要另外再求梯度。

Gradient descent ↩︎

扫描二维码关注公众号，回复： 9037509 查看本文章
Deep learning, Ian Goodfellow ↩︎
Linear Backprop in non-linear networks ↩︎

赵文淮

发布了10 篇原创文章 · 获赞 0 · 访问量 284

私信关注

猜你喜欢

转载自blog.csdn.net/eyeshere/article/details/100914648

深度学习-后向传播算法

深度学习前向后向传播公式推导

BP神经网络后向传播算法

【ZJU-Machine Learning】后向传播算法

吴恩达深度学习笔记(22)-深层神经网络说明及前后向传播实现

吴恩达深度学习笔记（11）-烧脑神经网络前向传播和后向传播计算

李宏毅机器学习笔记4：Brief Introduction of Deep Learning、Backpropagation(后向传播算法)

深度学习---反向传播算法BP

深度学习之反向传播算法

深度学习基础-反向传播算法

深度学习入门之反向传播算法

Neural networks and deep learning阅读笔记（2）后向传播算法

[源码解析] PyTorch 如何实现后向传播 (4)---- 具体算法

前向传播、后向传播

后向传播分类

深度学习 --- BP算法详解（误差反向传播算法）

【深度学习】BP算法-误差逆传播算法详解

【深度学习反向传播算法01】什么是反向传播算法？（求解梯度-链式求导法则）

深度学习-反向传播

【深度学习】BP反向传播算法Python简单实现

深度学习笔记三：反向传播（backpropagation）算法（转）

深度学习基础：反向传播即BP算法的推导过程

深度学习|反向传播算法（BP）原理推导及代码实现

深度学习之反向传播算法（BP）代码实现

神经网络与深度学习笔记——反向传播算法原理

深度学习入门笔记（六）：误差反向传播算法

深度学习：神经网络中的前向传播和反向传播算法推导

深度学习神经网络中的前向传播和反向传播算法推导

前向传播和后向传播

深度学习-正向传播&反向传播

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)