Stanford机器学习第四周：神经网络学习 - 代码天地

Stanford机器学习第四周：神经网络学习

其他 2018-08-16 20:21:07 阅读次数: 0

1 代价函数

神经网络分类表述：

代价函数（cost function）

2 反向传播算法

得到了神经网络的代价函数后，接下来要做的就是找到参数Θ使J(Θ)取得最小值：

假设整个训练集只有一个训练样本(x,y)，反向传播算法：

Forward propagation:

Backpropagation(反向传播)：

之所以叫反向传播是因为我们是从输出层开始计算的，计算时不存在计算δ⁽¹⁾是因为第一层对应输入层，这是我们在训练集观察到的，所以不会存在误差。

假设整个训练集有非常大的训练样本时，反向传播算法：

3 反向传播直观理解

Forward Propagation（从左往右计算）原理：

Backpropagation（从右往左计算）原理：

4 Implementation note:Unrolling parameters

上一节介绍了利用反向传播算法计算代价函数的导数，本节介绍一个细节的实现过程，怎样把你的参数从矩阵展开成向量，以便我们在高级最优化步骤中的使用需要。

使用矩阵表达式的好处是：当你的参数以矩阵形式存储时，你在进行正向传播和反向传播时更加方便，充分利用了向量化的实现过程。向量表达式的优点是：当你拥有thetaVec或者Dvec这样的矩阵时，当你使用高级优化算法时，这些算法通常要求所有的参数都要展开成一个长向量的形式。

5 梯度检验

当我们对一个较为复杂的模型（例如神经网络）使用梯度下降算法时，可能会存在一些不容易察觉的错误，为了避免这样的问题，我们采取一种叫做梯度检验的方法

梯度的数值估计，θ是一个实数

θ是一个n维向量

如果梯度的数值估计gradApprox与通过反向传播得到的DVec近似相等，就可以认为我们通过反向传播得到的DVec是正确的，就可以将DVec用在梯度下降或者其他优化算法里。一旦确定了反向传播算法是正确的就应该关闭梯度检验，如果不关闭会导致程序运行速度很慢。

6 Random initialization

对于梯度下降或者其他高级优化算法都需要进行参数Θ初始化，到目前为止我们都是初始所有参数为0，这样的初始方法对于逻辑回归来说是可行的，但是对于神经网络来说是不可行的。

也就是说每一次更新，图中两个隐藏单元都是相等的。这就阻止了神经网络学习一些有趣的事儿。解决方法就是参数要随机初始化，打破对称性。

7 Putting it together

选择神经网络的结构

训练神经网络

注意J(Θ)一般是非凸函数，通过梯度下降算法一般都能得到比较不错的局部最小值，尽管不能保证是全局最小值。

猜你喜欢

转载自blog.csdn.net/king_jie0210/article/details/67640177

Stanford机器学习第四周：神经网络学习

Stanford机器学习第四周：神经网络表述

04.神经网络与深度学习-第四周-深层神经网络

吴恩达机器学习第四周-神经网络

吴恩达机器学习笔记--第四周-3.神经网络的应用

吴恩达机器学习笔记--第四周-2.神经网络

第一门课：神经网络和深度学习（第四周）——深层神经网络

神经网络与深度学习第四周-Building your Deep Neural Network - Step by Step

Coursera-AndrewNg(吴恩达)机器学习笔记——第四周编程作业（多分类与神经网络）

吴恩达机器学习笔记--第四周-1.使用神经网络的动机

第四周（神经网络表示）-【机器学习-Coursera Machine Learning-吴恩达】

Stanford机器学习-Regularization

Stanford机器学习-Introduction

Stanford机器学习---第四讲. 神经网络的表示 Neural Networks representation

Stanford机器学习---第四讲神经网络的表示 Neural Networks representation

【中英】【吴恩达课后测验】Course 1 - 神经网络和深度学习 - 第四周测验

第一门课-深度学习和神经网络第四周（重点总结）

吴恩达深度学习（笔记+作业）·第一课·第四周深层神经网络

《深度学习——Andrew Ng》第四课第四周编程作业_2_神经网络风格迁移

Stanford机器学习-Logistic Regression

Stanford机器学习-降维

Stanford机器学习--聚类

Stanford机器学习-Matrices and vectors

Stanford机器学习-应用机器学习的建议

吴恩达深度学习课程之第一门课神经网络和深度学习第四周课程笔记

神经网络与深度学习课程笔记（第三、四周）

吴恩达深度学习第一课第四周深层神经网络搭建assignment4_1

01神经网络和深度学习-Building your Deep Neural Network: Step by Step-第四周编程作业1

01神经网络和深度学习-Deep Neural Network for Image Classification: Application-第四周编程作业2

第一课神经网络和深度学习第四周：编程作业 Deep Neural Network for Image Classification: Application

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)