李宏毅机器学习笔记-7 反向传播算法（Backpropagation）

其他 2018-05-28 04:46:56 阅读次数: 1

Backpropagation-反向传播算法

1 前言

1.1 为什么要用 Backpropagation

在神经网络中的梯度下降算法和之前求线性回归方程中用的没有太大的区别，都是不断的计算微分，然后更新参数，最终找到一个最优解。
但是在神经网络中，有着大量可能多达上百万个的参数，所以传统的求微分方法行不通，计算量太大无法快速有效的求出微分。

1.2 链式求导法则（Chain Rule）

Backprogation 中设计的最重要的数学知识就是 chain rule，通过下面的图片回顾一下。这个都不会就要回去读高中了。

2 Backpropagation

2.1 应该求什么

从上一节内容我们知道，每一个神经网络都需要定义一个 Loss Function, 用来定义实际输出与预期输出之间的误差 $C^n$ ，则总的误差就是

我们的目的就是要使上式的值最小。用 Gradient descent 来做的话就是这个式子对权值 $w$ 求偏导，即

由此我们知道只需要求每个 $C^n$ 对 $w$ 的偏导，然后全部加起来就可以了。

2.2 Forward pass
对上面这个 Neural 来说，根据 Chain Rule，

很明显，计算 $\partial z/ \partial w$ 是很容易的，如在上图中，

$\partial z/ \partial w_1 = x_1, \partial z/ \partial w_2 = x_2$ ,

即， $\partial z/ \partial w$ 就等于其所在边的输入。

2.3 Backward pass

所以我们剩下的问题是计算 $\partial C/ \partial z$ ，（贴公式真是太麻烦了 :cry:)，但是我们没办法直接算这个偏导，所以又要再做变换了。
由上图可知，

其中， $a = \sigma(z)$ ，所以 $\partial a / \partial z = \partial \sigma(z) / \partial z = \sigma ^ {'}(z)$ .
于是我们剩下的任务就是求 $\partial C / \partial a$ ,根据上图的公式我们知道剩下要求的就是 $和\partial C / \partial z ^{'} 和 \partial C / \partial z ^ {''}$ .
接下来，我们假设 $和\partial C / \partial z ^{'} 和 \partial C / \partial z ^ {''}$ 是已知的（通过某些神奇的方法算出来了），于是将上述的东西凑起来，我们就可以算出
然后，我们继续假设下一层是输出层，如下图

我们发现，图中的公式是可以计算的（看不出来就多看几遍，再看不出来就假装已经看出来了），于是我们把所有要求的都求出来了,就可以计算微分值了。
但是，如果下一层不是输出层呢？那就把问题继续往下一层传递，直到输出层，然后就可以从最后一层一直往前计算回来了。如下图，相当于把输出作为输入，建立一个反向的神经网络。

3. 总结
所以，Backpropagation 算法的流程就是：
1. Forward Pass： 算出每一层的输出 $a$ ，也就是 $\partial z/ \partial w$ .
2. Backward Pass： 反转神经网络，从输出层往回计算每一层的 $\partial C/ \partial z$ .
3. 将前面算出来的两项相乘，得到 $\partial C/ \partial w$ .
对我来说，我觉得把这个算法过程当成是一次递归就会很好理解，Forward Pass 就是函数一层层的调用，达到返回条件（在BackPropagation中是遇到输出层）就开始返回，也就是 Backward Pass.
最后，写一堆公式和符号真是麻烦啊！

猜你喜欢

转载自blog.csdn.net/memoryd/article/details/80312135

【李宏毅机器学习笔记】7、反向传播（Backpropagation）

李宏毅机器学习笔记-7 反向传播算法（Backpropagation）

7、【李宏毅机器学习（2017）】Backpropagation（反向传播算法）

7、Backpropagation（反向传播算法）

[李宏毅-机器学习]反向传播Backpropagation

台大李宏毅-- 反向传播算法 Backpropagation

李宏毅机器学习——学习笔记（7） Backpropagation and keras

李宏毅机器学习笔记4：Brief Introduction of Deep Learning、Backpropagation(后向传播算法)

深度学习笔记三：反向传播（backpropagation）算法（转）

李宏毅机器学习 P14 Backpropagation 笔记

神经网络反向传播Backpropagation（李弘毅机器学习）

深度学习中的反向传播方法—BackPropagation

深度学习笔记（三）：backpropagation反向传播算法python代码讲解

神经网络和深度学习（二）——BP(Backpropagation Algorithm, 反向传播算法)

Intro to Deep Learning & Backpropagation 深度学习模型介绍及反向传播算法推导详解

反向传播算法 — Backpropagation

李宏毅机器学习课程笔记3：Backpropagation、"Hello world" of Deep Learning、Tips for Training DNN

李宏毅深度学习_Backpropagation

反向传播(BackPropagation)算法的推导

反向传播(Backpropagation)算法详解

学习反向传播算法

李宏毅机器学习笔记(7)

机器学习笔记1：神经网络反向传播(Backpropagation) week5

[Deep Learning] 反向传播算法（Backpropagation Algorithm）

李宏毅深度学习 -2017-backpropagation

反向传播算法学习

《深度学习》李宏毅 -- task4深度学习介绍和反向传播机制

CNN笔记（CS231N）——反向传播和神经网络（Backpropagation and Neural Networks）

【ML】反向传播 —BackPropagation

机器学习反向传播算法的数学推导

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)