深度学习基础：反向传播即BP算法的推导过程 - 代码天地

深度学习基础：反向传播即BP算法的推导过程

其他 2018-11-01 00:11:29 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/nxcxl88/article/details/52295374

BP算法简单的来说就是根据神经网络实际的输出和目标输出（也就是输入样本对应的标记）之间的误差计算神经网络各个权值的过程。

下面的推导过程参考了《神经网络设计》 Martin T. Hagan等著戴葵等译。

采用BP算法从输出层、经过隐层再到输入层进行层层计算的原因是如果直接计算误差函数相对于各权值的偏导很难得到显式的表达函数（最小均方算法或Widrow-Hoff学习算法），采用从后向前递推的方式大幅度的利用了前期的计算值，也使得网络具备了更多的灵活性。

使用均方误差作为性能指数，那么优化算法的目标就是调整网络的参数使得均方误差最小化。那么根据最速下降算法的原理，第k次迭代计算得到的权值和偏移如下：

其中，m是层序号，i是神经元在层中序号，j则是一个神经元的输入的序号，是均方误差。

前面就提到了，求这两个偏导是很困难的事情，因此可以使用链式法则从最后一层向前计算。根据链式法则，可以将偏导分解如下：

其中，是m-1层神经元的输出。

乘号后面的偏导数很容易求得，，也就是上一层神经元的输出，。因此重要的是求出

很难直接求出，那么也就考虑能不能够用链式法则类似的递推方式解决，但是注意这里面，每一层里面有多个神经元，而每个神经元都与上一层里面的多个神经元相连，因此，像下面的这个表达式是错误的，因为链式法则要求偏导的拆分，必须保证这个能够完全用中间变量表示，而应该是一个向量。从直观上考虑，m层和m+1层的神经元个数也不一样，所以也不能这样表示。

因此，采用矩阵的表示方法来表示神经元的计算，如下面这个图所示。

经过一系列推导可以得到，敏感性（《神经网络设计》这本书中的例子）

的表达式（注意这是个向量），应该是，这里面的是一个对角阵，其对角线的元素对应的是m层上的每个神经元激活函数对应其输入的导数。

对于BP算法来说，最后一层的计算（第M层）是所有计算的开始。其矩阵形式的表达式为。这里面存在一个系数2，是因为使用的是均方误差，平方求导会有系数2.

因此如果用矩阵形式表示，那么权值和偏置值更新的表达式是：

因此，总的说来，反向传播算法需要用到的数据是：

1. 学习率

2. 激活函数相对于其输入的导数，用于计算

3. 上一层神经元的输出

4. 每次迭代的权值和偏移

猜你喜欢

转载自blog.csdn.net/nxcxl88/article/details/52295374

深度学习基础：反向传播即BP算法的推导过程

深度学习|反向传播算法（BP）原理推导及代码实现

深度学习 — 反向传播(BP)理论推导

结合斯坦福深度学习教程对于BP反向传播算法原理的推导过程解析（转）

BP反向传播算法推导

深度学习---反向传播算法BP

深度学习基础--反向传播推导

反向传播算法的公式推导（BP算法）

深度学习 --- BP算法详解（误差反向传播算法）

深度学习笔记（基础篇）——（三）神经网络和反向传播算法（BP）

【深度学习基础】反向传播BP算法原理详解及实战演示（附源码）

【深度学习】BP反向传播算法Python简单实现

深度学习之反向传播算法（BP）代码实现

深度学习基础-反向传播算法

BP反向传播公式推导

深度学习-神经网络 BP 算法推导过程

反向传播算法（过程及公式推导）

BP神经网络反向传播算法推导原理

反向传播 (BP) 算法公式推导与python (numpy) 实现

神经网络——反向传播BP算法公式推导

神经网络-反向传播BP算法推导

BP反向传播算法

反向传播BP算法

学习笔记——反向传播算法（BP）

机器学习-BP(误差反向传播算法)

深度学习反向传播公式推导

深度学习之反向传播推导

深度学习-*-正向及反向传播推导

深度学习：神经网络中的前向传播和反向传播算法推导

深度学习神经网络中的前向传播和反向传播算法推导

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)