反向传播算法—从四个基本公式说起 - 代码天地

反向传播算法—从四个基本公式说起

其他 2019-07-22 23:04:51 阅读次数: 0

反向传播四公式：

　　反向传播的最终目的是求得使代价C最小时w、b的最佳值，为了方便计算引入了神经单元误差δ_j^l，其定义为误差C关于某个神经单元z的关系；

　　其定义如上所示，某神经元误差为代价C（总误差）关于z的偏导数，其中l为神经网络的层数，j为第几个神经元；
　　这里的代价函数（损失函数）使用的是平方误差，因此C等于：

BP1

　　此公式用于求神经网络最后一层神经元的误差，下面通过BP1公式用于求最后一层神经元（输出层）中第一个神经元的误差；

根据链式法则由此可得到上诉四个公式中得前面BP1

BP1中得L为神经网络得最后一层，而在我们此网络中最后一层为3，所以此处L=3；

BP2

　　BP2与BP1类似，不同得是BP1用于求最后一层神经元误差，而BP2则是用于求L层前面某一层得神经元误差，下面通过BP2公式用于求第二层神经元中的第一个神经元的误差；
同样我们也可通过链式法则得出：

有：

因此可以得：

将公式转换为矩阵模式，第2层神经元得误差为：

我们将BP1与BP2带入即可得到BP3与BP4；
通过BP1与BP2公式即可通过BP3、BP4轻松得到w与B；

BP3

此公式用于求误差C关于某个权重的偏导数，在求得BP2后此处只需吧BP2带入到公式即可求得BP3；

BP4

　　求误差C关于偏置b的偏导数，BP4与BP3一样得到BP2即可带入得出BP4；

　　反向传播算法给出了一种用于计算代价函数（损失函数）梯度得方法，具体步骤如下：

数据计算

一、前向传播

1、计算第二层
　　矩阵形式：

2、计算第三层
　　矩阵形式：

二、计算误差

当前使用的为平方损失函数（代价函数）；

三、计算输出层神经元误差

矩阵形式：

　　输出层第一个神经元误差δ_1^3：

　　输出层第一个神经元误差δ_2^3：

四、计算其余层神经元误差

矩阵形式：

五、计算误差C关于w、b的梯度

　　此处用的是BP3与BP4公式，在计算出BP1与BP2后将其带入到公式中即可计算出C关于w、b的梯度；
矩阵形式：

矩阵形式：

更新w、b公式：

　　在计算出误差C关于每个权重每个偏置的偏导数后再使用得到的值带入上述公式更新每一个w、b即可，在更新完成w、b后如误差达到指定精度或epochs则继续执行上述的2-5步骤直到误差满意或指定epochs为止；

猜你喜欢

转载自www.cnblogs.com/softlin/p/11228883.html

反向传播算法—从四个基本公式说起

[深度学习] 反向传播的四个基本公式证明及算法流程

反向传播四个公式的证明

第二节，神经网络中反向传播四个基本公式——BackPropagation

深度学习与计算机视觉：搞懂反向传播算法的四个基本方程

神经网络与深度学习反向传播算法的四项基本公式

【菜菜的CV进阶之路-神经网络的深入理解-十三】反向传播背后的四个基本等式

反向传播算法的公式推导

CNN反向传播算法公式

反向传播算法的公式推导（BP算法）

基本RNN反向传播公式的推导

公式推导(四)——Softmax的反向传播

反向传播算法（过程及公式推导）

反向传播公式推导

CNN的反向传播公式

深度学习（四）之反向传播与梯度下降（公式推导）

反向传播算法几个重要公式的详细推导

deeplearning.ai-正向和反向传播算法公式

反向传播 (BP) 算法公式推导与python (numpy) 实现

神经网络——反向传播BP算法公式推导

BP反向传播公式推导

Softmax 反向传播公式推导

ResNet反向传播公式推导

os 的四个基本特征

java的四个基本特征

7四个基本子空间

事物的四个基本特征

webpack四个基本概念

矩阵的四个基本子空间

基本的 HTML 标签 - 四个实例

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)