反向传播算法-机器学习（machine learning）笔记（Andrew Ng）

其他 2018-08-18 10:14:03 阅读次数: 0

反向传播算法（back propagation algorithm）
- 基本概念

反向传播算法（back propagation algorithm）

基本概念

BP算法(即反向传播算法)是在有导师指导下，适合于多层神经元网络的一种学习算法，它建立在梯度下降法的基础上。
旨在得到最优的全局参数矩阵，进而将多层神经网络应用到分类或者回归任务中去。

δ_{j}^{(l)} =" e r r o r " o f n o d e j i n l a y e r l .

$\delta^{(l)}_j="error"\,of\,node\,j\,in\,layer\,l.$

δ

$\delta$ 代表的是假设

h (x)

$h(x)$ 的输出和训练集

y

$y$ 值之间的差，即

δ_{j}^{(l)} = a_{j}^{(l)} - y_{j}

$\delta^{(l)}_j=a^{(l)}_j-y_j$
如果把

δ, a, y

$\delta,a,y$ 都看做向量，则可以用向量化表达式来表示：

δ^{(l)} = a^{l} - y

$\delta^{(l)}=a^l-y$
接下来计算前面几层（隐含层直到输出层）的误差：

δ^{(l - 1)} = (Θ^{(l - 1)})^{T} δ^{(l)} . * g^{'} (z^{(l - 1)})

$\delta^{(l-1)}=(\Theta^{(l-1)})^T\delta^{(l)}.*g^\prime(z^{(l-1)})$

. . .

$...$

δ^{(2)} = (Θ^{(2)})^{T} δ^{(3)} . * g^{'} (z^{(2)})

$\delta^{(2)}=(\Theta^{(2)})^T\delta^{(3)}.*g^\prime(z^{(2)})$

$.*$ 是两个向量间元素对应相乘，没有 $\delta^{(1)}$ ，因为那是我们在训练集所观察到的，不会有误差。
在算法的开始，我们令

Δ_{i j}^{(l)} = 0

$\Delta^{(l)}_{ij}=0$
然后计算出所有的

δ

$\delta$ 之后，对其在

Δ

$\Delta$ 上进行累加：

Δ_{i j}^{(l)} := Δ_{i j}^{(l)} + a_{j}^{(l)} δ_{i}^{(l + 1)}

$\Delta^{(l)}_{ij}:=\Delta^{(l)}_{ij}+a^{(l)}_j\delta^{(l+1)}_i$
将其写成向量形式，

i j

$ij$ 对应矩阵下标，可以得到：

Δ^{(l)} := Δ^{(l)} + δ^{(l + 1)} (a^{(l)})^{T}

$\Delta^{(l)}:=\Delta^{(l)}+\delta^{(l+1)}(a^{(l)})^T$
接下来，我们分情况计算：

D_{i j}^{(l)} := \frac{1}{m} Δ_{i j}^{(l)} + λ Θ_{i j}^{(l)}, i f j \neq 0

$D^{(l)}_{ij}:=\frac{1}{m}\Delta^{(l)}_{ij}+\lambda\Theta^{(l)}_{ij},if\,j\neq0$

D_{i j}^{(l)} := \frac{1}{m} Δ_{i j}^{(l)}, i f j = 0

$D^{(l)}_{ij}:=\frac{1}{m}\Delta^{(l)}_{ij},if\,j=0$
通过证明可以发现：

\frac{\partial}{\partial Θ_{i j}^{(l)}} J (Θ) = D_{i j}^{(l)}

$\frac{\partial}{\partial \Theta^{(l)}_{ij}}J(\Theta)=D^{(l)}_{ij}$
未完…

猜你喜欢

转载自blog.csdn.net/sinat_25721683/article/details/79240190

反向传播算法-机器学习（machine learning）笔记（Andrew Ng）

线性回归-机器学习（machine learning）笔记（Andrew Ng）

神经网络-机器学习（machine learning）笔记（Andrew Ng）

过度拟合-机器学习（machine learning）笔记（Andrew Ng）

多类别分类-机器学习（machine learning）笔记（Andrew Ng）

分类问题-机器学习（machine learning）笔记（Andrew Ng）

降维-机器学习（machine learning）笔记（Andrew Ng）

异常检测-机器学习（machine learning）笔记（Andrew Ng）

聚类-机器学习（machine learning）笔记（Andrew Ng）

Andrew Ng machine learning课程笔记--机器学习的动机与应用

Andrew Ng machine learning 课程笔记--生成学习算法

Andrew Ng machine learning 课程笔记--顺序最小优化算法

学习笔记之Machine Learning by Andrew Ng | Coursera

Machine Learning Yearning(Andrew Ng)

Machine Learning Note - Andrew Ng

andrew ng machine learning week1 课堂笔记

Andrew Ng machine learning 课程笔记--牛顿方法

Andrew Ng machine learning 课程笔记--特征选择

Deep Learning by Andrew Ng 学习笔记之人脸识别

Deep Learning by Andrew Ng 学习笔记之Neural Style Transfer

机器学习（Machine Learning）- 吴恩达（Andrew Ng）学习笔记（一）

机器学习（Machine Learning）- 吴恩达（Andrew Ng）学习笔记（四）

机器学习（Machine Learning）- 吴恩达（Andrew Ng）学习笔记（二）

机器学习（Machine Learning）- 吴恩达（Andrew Ng）学习笔记（六）

机器学习（Machine Learning）- 吴恩达（Andrew Ng）学习笔记（七）

机器学习（Machine Learning）- 吴恩达（Andrew Ng）学习笔记（十三）

机器学习（Machine Learning）- 吴恩达（Andrew Ng）学习笔记（十一）

机器学习（Machine Learning）- 吴恩达（Andrew Ng）学习笔记（十六）

【Machine Learning@Andrew Ng, Coursera】机器学习Week1 单变量线性回归笔记

【Machine Learning@Andrew Ng, Coursera】机器学习Week1 导论部分重点笔记

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)