神经网络的BP推导

其他 2019-04-14 13:42:21 阅读次数: 0

版权声明：原创博客未经允许请勿转载！ https://blog.csdn.net/holmes_MX/article/details/85261211

0. 写作目的

好记性不如烂笔头。

注意：本博客的求导法则，也许和其他地方不同，主要区别在于是否把链式法则中间的求导省略，如果不省略中间的求导则是本文的推导过程，如果省略则是常见的推导过程。其本质都是一样。

1. 定义

以多层神经元网络为例进行分析。网络如下图所示。

定义：网络共 m 层，第 k 层的第 i 个神经元到第 (k + 1) 层的第 j 个神经元之间的权重为 $w_{ij}^{k}$ 。第 k 层的第 i 个神经元的输入为 $I_{i}^{k}$ ，第 k 层的第 i 个神经元的输出为 $O_{i}^{k}$ 。激活函数设置为 f。

则 $O_{i}^{k}=f\left ( I_{i}^{k} \right )$

定义单个样本的loss函数为：

$J=\frac{1}{2}\sum_{d=1}^{d=D}\left ( O_{d}^{m} -y_{d}\right )^{2}$ 或者 $J=\frac{1}{2}\left \|O^{m}-y \right \|_{2}^{2}$

其中 $O_{d}^{m}$ 为网络的输出值，即第 m 层网络的每一维的输入值， $y_{d}$ 为样本每一维的理论值。

$\frac{\partial J}{\partial w_{ij}^{\left ( k-1 \right )k}}=\frac{\partial J}{\partial O_{j}^{k}} \frac{\partial O_{j}^{k}}{\partial I_{j}^{k}} \frac{\partial I_{j}^{k}}{\partial w_{ij}^{\left ( k-1 \right )k}}=\frac{\partial J}{\partial O_{j}^{k}} f{\left ( I_{j}^{k} \right )}'O_{i}^{k-1}$

对于反向求导过程中，所需要的变量，我们只需要求出 $\frac{\partial J}{\partial O_{j}^{k}}$ 即可，其他变量可以从正向传播中得到。因此下图给出了如果求反向传播过程中的 $\frac{\partial J}{\partial O_{j}^{k}}$ 。

[Reference]

[1] 英文版的BP理解 (推荐看)：http://neuralnetworksanddeeplearning.com/chap2.html

猜你喜欢

转载自blog.csdn.net/holmes_MX/article/details/85261211

神经网络的BP推导

BP神经网络算法推导

BP神经网络推导过程详解

BP神经网络原理公式推导

BP神经网络说明及推导

神经网络的BP推导过程

神经网络和BP算法推导

BP神经网络原理推导

BP神经网络公式推导

BP神经网络：误差反向传播公式的简单推导

BP神经网络原理推导（学习笔记）

BP神经网络后向传播公式推导

前馈神经网络 BP算法推导

BP神经网络公式推导及实现(MNIST)

BP神经网络反向传播算法推导原理

多层神经网络BP算法原理及推导

深度学习-神经网络 BP 算法推导过程

【机器学习算法推导】BP神经网络

BP神经网络公式推导及实现 MNIST

BP神经网络算法推导及代码实现笔记zz

神经网络——反向传播BP算法公式推导

深度学习(3): BP神经网络推导及实验

神经网络-反向传播BP算法推导

神经网络（三）—— BP算法基本推导

卷积神经网络 CNN BP算法推导

神经网络详细解释（包含BP算法的推导）

BP神经网络误差反向传播公式简单推导

BP神经网络的详细推导与完整代码

BP反向传播神经网络的公式推导

BP神经网络

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)