关于反向传播详细过程(BP神经网络，RNN通用)

其他 2020-01-29 22:44:34 阅读次数: 0

关于反向传播的笔记

1.把这个带隐藏层的神经网络做为例子

2.前向传播

1.输入层---->隐含层：

神经元h1的输出o1:(此处用到激活函数为sigmoid函数)：

同理，可计算出神经元h2的输出o2：

2.隐含层---->输出层：

计算输出层神经元o1和o2的值：

这样前向传播的过程就结束了，我们得到输出值为[0.75136079 , 0.772928465]，与实际值[0.01 , 0.99]相差还很远，现在我们对误差进行反向传播，更新权值，重新计算输出。

3.反向传播

1.计算总误差

总误差：(square error)

但是有两个输出，所以分别计算o1和o2的误差，总误差为两者之和：

2.隐含层---->输出层的权值更新：

以权重参数w5为例，如果我们想知道w5对整体误差产生了多少影响，可以用整体误差对w5求偏导求出：（链式法则）

下面的图可以更直观的看清楚误差是怎样反向传播的：

现在我们来分别计算每个式子的值：

计算：

计算：

（这一步实际上就是对sigmoid函数求导，比较简单，可以自己推导一下）

计算：

最后三者相乘：

这样我们就计算出整体误差E(total)对w5的偏导值。

回过头来再看看上面的公式，我们发现：

为了表达方便，用来表示输出层的误差：

因此，整体误差E(total)对w5的偏导公式可以写成：

如果输出层误差计为负的话，也可以写成：

最后我们来更新w5的值：

（其中，是学习速率，这里我们取0.5）

同理，可更新w6,w7,w8:

3.隐含层---->隐含层的权值更新：

　方法其实与上面说的差不多，但是有个地方需要变一下，在上文计算总误差对w5的偏导时，是从out(o1)---->net(o1)---->w5,但是在隐含层之间的权值更新时，是out(h1)---->net(h1)---->w1,而out(h1)会接受E(o1)和E(o2)两个地方传来的误差，所以这个地方两个都要计算。

计算：

先计算：

同理，计算出：

两者相加得到总值：

再计算：

再计算：

最后，三者相乘：

为了简化公式，用sigma(h1)表示隐含层单元h1的误差：

最后，更新w1的权值：

同理，额可更新w2,w3,w4的权值：

这样误差反向传播法就完成了，最后我们再把更新的权值重新计算，不停地迭代，在这个例子中第一次迭代之后，总误差E(total)由0.298371109下降至0.291027924。迭代10000次后，总误差为0.000035085，输出为[0.015912196,0.984065734](原输入为[0.01,0.99]),证明效果还是不错的

站内首发文章

麦子点点科技

发布了27 篇原创文章 · 获赞 20 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_33479881/article/details/85060723

关于反向传播详细过程(BP神经网络，RNN通用)

BP神经网络反向传播之计算过程分解（详细版）

BP神经网络，误差反向传播

反向传播神经网络（BP）

神经网络反向传播BP算法

BP 神经网络（反向传播的神经网络）的解读

神经网络--反向传播详细推导过程

循环神经网络RNN的前向传播与反向传播

反向传播神经网络（BP网络）介绍及Java实现

神经网络BP反向传播算法原理和详细推导流程

神经网络之反向传播算法（BP）公式推导（超详细）

深度学习：前馈神经网络与BP反向传播

BP神经网络：误差反向传播公式的简单推导

神经网络之反向传播算法（BP）

ML（5）——神经网络2（BP反向传播）

BP神经网络反向传播算法推导原理

神经网络知识点1 - BP反向传播

深度神经网络（DNN）反向传播算法(BP)

通俗理解神经网络BP反向传播算法

神经网络中反向传播算法（BP）

全连接神经网络的反向传播算法（BP）

神经网络——反向传播BP算法公式推导

神经网络-反向传播BP算法推导

编程作业4.1：神经网络反向传播（BP算法）

神经网络(二)：反向传播步骤(BP)

BP神经网络误差反向传播公式简单推导

神经网络反向传播BP算法代码实现

神经网络反向传播BP算法举例说明

BP反向传播神经网络的公式推导

深度神经网络（DNN）反向传播算法(BP) 深度神经网络（DNN）反向传播算法(BP)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)