CS231n 反向传播 Backprop - 代码天地

CS231n 反向传播 Backprop

其他 2018-09-22 14:40:56 阅读次数: 0

https://zhuanlan.zhihu.com/p/21407711?refer=intelligentunit

反向传播梯度（偏导数）

函数关于每个变量的导数指明了整个表达式对于该变量的敏感程度。

先考虑一个简单的二元乘法函数f(x,y)=xy。对两个输入变量分别求偏导数还是很简单的：
$\displaystyle f(x,y)=xy \to \frac {df}{dx}=y \quad \frac {df}{dy}=x$ 若 $x=4,y=-3，则f(x,y)=-12$ ， $x$ 的导数 $\frac{\partial f}{\partial x}=-3$ 。这就说明如果将变量x的值变大一点，整个表达式的值就会变小（原因在于负号），而且变小的量是x变大的量的三倍。

对前向传播变量进行缓存：在计算反向传播时，前向传播过程中得到的一些中间变量非常有用。在实际操作中，最好代码实现对于这些中间变量的缓存，这样在反向传播的时候也能用上它们。如果这样做过于困难，也可以（但是浪费计算资源）重新计算它们。

在不同分支的梯度要相加：如果变量x，y在前向传播的表达式中出现多次，那么进行反向传播的时候就要非常小心，使用+=而不是=来累计这些变量的梯度（不然就会造成覆写）。这是遵循了在微积分中的多元链式法则，该法则指出如果变量在线路中分支走向不同的部分，那么梯度在回传的时候，就应该进行累加。

回传流中的模式
神经网络中最常用的加法、乘法和取最大值这三个门单元，加法操作将梯度相等地分发给它的输入。取最大操作将梯度路由给更大的输入。乘法门拿取输入激活数据，对它们进行交换，然后乘以梯度。

猜你喜欢

转载自blog.csdn.net/eqiang8848/article/details/82255506

CS231n 反向传播 Backprop

【cs231n】反向传播笔记

# cs231n （四）反向传播

CS231n课程笔记翻译：反向传播笔记

CS231n笔记（4）反向传播

cs231n 学习笔记（4）- 反向传播

Cs231n课堂内容记录-Lecture 4&5 最优化&反向传播

CNN笔记（CS231N）——反向传播和神经网络（Backpropagation and Neural Networks）

cs231n 笔记02：反向传播与2-NN示例

神经网络反向传播向量化（CS231n AI Q4）

cs231n----反向传播

cs231_n4.1_反向传播

cs231n-反向传播与神经网络

反向传播与梯度下降直观示例的演算与结论（斯坦福cs231n/cs229课程相关）

<反向传播(backprop)>梯度下降法gradient descent的发展历史与各版本

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播

CS231n

CS231n：

CS 231n 学习笔记 05——课程4.1 神经网络入门之：反向传播

CS231n-2017 第4讲反向传播算法与神经网络

cs231n knn

cs231n笔记

Backprop KF: Learning Discriminative Deterministic State Estimators 反向传播卡尔曼滤波:学习判别确定性状态估计器

cs231n-----BP反响传播算法

cs231n : Convolutional Neural Networks

cs231n : Transfer Learning

Stanford CS231n Notes

cs231n神经网络

【cs231n学习笔记】——— KNN

CS231n assignment2

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)