CS231n Lecture4-Introduction to Neural Networks - 代码天地

CS231n Lecture4-Introduction to Neural Networks

其他 2020-03-30 22:01:20 阅读次数: 0

1. Gradient

我们需要观察数据的变化程度，于是导数就出现了，但是有些函数中包含多个变量，就存在这针对于每个变量的导数，也就是偏导数。（插图）
梯度就是偏导数的向量，然后可能是以向量的形式，存储着多个变量的偏导数，合在一起就是梯度。（插图）
对于一些特殊的函数的梯度，需要注意，比如Max,它是以数据大的一方为偏导数为1，然后乘以后面传来的值，如果小的一方，偏导数为0乘以后面传来的值，得到的结果自然为0了.

2. Chain rule

链式法则: 链式法则告诉我们，把这些梯度表达式连在一起的正确方法是乘法(插图)

3. Backpropagation

直白的讲，首先我们进行前向传播，然后就可以进行反向传播了，第一步是接收从后方传来的梯度，第二步是计算自己结点上的梯度，二者进行相乘就得到了当前结点上的偏导数。
一个例子，插图讲解。

4. Patterns in backward flow

add gate: 加法的梯度后面传来的值，与当前值直接乘以1，得到结果，也就是说，经过加法门，后面传来的值与从该门往前传的值不变。
max gate: 这个比较特殊，值到的一方变量该结点上的梯度为1，小的一方梯度为0，然后最后的结果就是分别乘以后面传来的值，得到最终往前传的梯度，也就是该结点的梯度。
multiply gate: 这个比较容易理解，当前结点的梯度就像普通的函数分别求偏导数即可，然后分别与后面传来的值相乘，便得到各自的最终梯度。

5. Gradients for vectorized operations

simple case

# forward pass
W = np.random.randn(5, 10)
X = np.random.randn(10, 3)
D = W.dot(X)

# now suppose we had the gradient on D from above in the circuit
dD = np.random.randn(*D.shape) # same shape as D
dW = dD.dot(X.T) #.T gives the transpose of the matrix
dX = W.T.dot(dD)

related document on taking matrix/vector derivatives

猜你喜欢

转载自www.cnblogs.com/tsruixi/p/12601510.html

CS231n Lecture4-Introduction to Neural Networks

CS231n笔记 Lecture 4 Introduction to Neural Networks

cs231n 学习 -- Lecture 4 Backpropagation and Neural Networks

CS231n: Lecture 10 | Recurrent Neural Networks

cs231n 学习 -- Lecture 5 Convolutional Neural Networks

cs231n学习笔记-lecture4（Backpropagation and Neural Networks）以及作业解答

cs231n : Convolutional Neural Networks

【CS231n】Lecture 6：Training Neural Networks,Part 2

CS231n Lecture5-Convolutional Neural Networks学习笔记

CS231n Lecture6-Training Neural Networks, part I学习笔记

cs231n 学习 -- Lecture 6/7 Training Neural Networks

CS231n Convolutional Neural Networks for Visual Recognition

CS231n:Convolutional Neural Networks for Visual Recognition

训练神经网络（CS231n 7. Training Neural Networks II）

CS231n 7. Training Neural Networks II 训练神经网络

CS231n Convolutional Neural Networks (CNNs / ConvNets) 神经网络1

CS231n: Convolutional Neural Networks for Visual Recognition, Summary and Assignments

CS231n Convolutional Neural Networks for Visual Recognition------Scipy and MatplotlibTutorial

CNN笔记（CS231N）——卷积神经网络（Convolutional Neural Networks）

CNN笔记（CS231N）——训练神经网络II（Training Neural Networks, Part 2）

CNN笔记（CS231N）——循环神经网络（Recurrent Neural Networks）

CNN笔记（CS231N）——训练神经网络I（Training Neural Networks, Part I）

CNN笔记（CS231N）——反向传播和神经网络（Backpropagation and Neural Networks）

CS231n课程笔记：Leture7 Training Neural Networks II

CS231n课程笔记：Leture6 Training Neural Networks I

CS231n课程笔记：Leture5 Convolutional Neural Networks

CS231n课程笔记：Leture4 Backpropagation and Neural Network

CS231n assignment2 Q4 Convolutional Networks

cs231n neural network 笔记

[cs224n] Lecture 3 – Neural Networks

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)