吴恩达深度学习课程——改善深层神经网络

其他 2018-06-08 05:09:02 阅读次数: 2

一、深度学习的实用层面

1. 训练集（train set）、验证集（development set）、测试集（test set）

2.偏置（bias）与方差（variance）

bias-variance trade-off：根据训练集验证集误差来判断

3. 正则化（避免过拟合）

1. L2正则化

正则化作用的直观理解：

2. Dropout正则化（inverted dropout随机反向失活）

修正或弥补所需的那20%，确保期望值不变

测试阶段不使用Dropout

单元的输入可能被随机清除，不愿意把所有赌注放在一个节点上，产生收缩权重的平方范数的效果
（1）除非算法过拟合，不然不会使用

（2）其缺点是代价函数J不再被明确定义，失去了调试工具。通常先关闭dropout，确保J单调递减，再打开dropout函数。

3. Data augmentation（数据扩增）

4. Early stopping

提早停止训练神经网络，选择参数W范数较小的神经网络

机器学习包括几个步骤：
（1）选择一个算法来优化代价函数J
（2）避免过拟合
也称正交化（Orthogonalization）：在一个时间做一个任务。
其缺点是不能独立地处理这两个问题，没有采取不同的方式来解决这两个问题，而是用一种方法同时解决两个问题。

如果不用early stopping，另一种方法是L2正则化。

4.正则化输入

（1）零均值化
（2）归一化方差

注：训练集和测试集归一化的均值和方差相同

如果特征值范围相差很大，则必须使用一个非常小的学习率，学习算法运行得慢

5. 梯度消失与梯度爆炸

权重W只比1略大一点，深度神经网络的激活函数将爆炸式增长；略小一点，激活函数将以指数级递减。

梯度下降算法的步长会非常非常小，将花费很长的时间来学习

6. 权重初始化

调参优先级低

7. 梯度检验

在backprop中执行梯度检验，使用双边误差的方法更逼近导数

技巧：

二、优化算法

1.mini-batch梯度下降法

one epoch一次遍历训练集

mini-batch大小的选择问题：

典型值：64~512（2的指数次方）

2.指数（移动）加权平均

一个大致的思考方向（非正式的数学证明）：

相比直接平均的优点：只占单行数字的存储和内存，不用存储太多历史数据，只用带入最新数据。

偏差校正（让平均数运算更加准确）

当t很大时，偏差修正几乎没有作用。（此时本来紫线基本和绿线重合）

3.动量梯度下降法（Momentum）

纵轴上的摆动平均值接近于0，横轴方向的平均值仍然较大。因而几次迭代后，纵轴方向的摆动变小了，横轴方向运动更快（走了一条更加直接的路径，在抵达最小值的路上减少了摆动）。

在使用梯度下降法或者Momentum时，人们不会受到偏差修正的困扰。

4. RMSprop（root mean square）

纵轴方向的摆动较小，横轴方向继续前进。这样就可以用一个更大的学习率α，加快学习

为了确保数值稳定，加一个很小的数

与Momentum的相似之处：可以消除梯度下降中的摆动，允许使用一个更大的学习率，从而加快算法的学习速度。

5. Adam（Adaptive Moment Estimation）

尝试不同的α值，其他的取默认值就可以了

6. learning rate decay（学习率衰减）

7. 局部最优的问题

在高维空间中（maybe2000个参数），更多梯度为0的点不是局部最值（local optimum），而是鞍点（saddle point）

平稳段会减缓学习，这也是复杂的学习算法能够加速学习的地方。

猜你喜欢

转载自blog.csdn.net/eartha1995/article/details/80406580

吴恩达深度学习课程——改善深层神经网络

吴恩达深度学习课程笔记（二）：改善深层神经网络

吴恩达深度学习课程第二课-改善深层神经网络

Coursera吴恩达《神经网络与深度学习》课程笔记（5）-- 深层神经网络

Coursera吴恩达课程笔记 1.5《神经网络与深度学习》-- 深层神经网络

吴恩达深度学习——深层神经网络

《深度学习工程师-吴恩达》02改善深层神经网络--深度学习的实用层面学习笔记

02.改善深层神经网络课程总结 -- 吴恩达(deeplearning.ai)

《深度学习工程师-吴恩达》02改善深层神经网络--优化算法学习笔记

吴恩达改善深层神经网络参数：超参数调试、正则化以及优化——深度学习的实用层面

1.4 正则化-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

3.12 总结-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

3.11 TensorFlow-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

吴恩达deep learning ai 笔记总结(2-1) 改善深层神经网络-深度学习的实践方面

1.13 梯度检验-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

1.2 偏差/方差-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

3.8 Softmax 回归-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

吴恩达深度学习课程——卷积神经网络

吴恩达神经网络与深度学习章节笔记（三）——深层神经网络

3.5 将 Batch 拟合进神经网络-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

1.11 神经网络的权重初始化-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

吴恩达Coursera深度学习课程 DeepLearning.ai 提炼笔记（1-4）-- 深层神经网络

吴恩达Coursera深度学习课程 course1-week4 深层神经网络作业

吴恩达深度学习神经网络与深度学习深度神经网络课程作业

吴恩达深度学习神经网络与深度学习浅层神经网络课程作业

吴恩达《改善深层神经网络：超参数调试、正则化以及优化》课程总结

干货|吴恩达 DeepLearning.ai 课程提炼笔记（2-1-1）改善深层神经网络 --- 深

3.10 深度学习框架-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

【吴恩达深度学习笔记-改善深层神经网络】——第一周深度学习的实用层面（1.4）

【吴恩达深度学习笔记-改善深层神经网络】——第一周深度学习的实用层面（1.2）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)