吴恩达心得 - 代码天地

吴恩达心得

其他 2019-04-22 17:23:20 阅读次数: 0

一课中提出

1）大数据下的神经网络模型运用很少，是由于训练迭代需要大量时间。因此需要一个好的训练算法来节约时间

2）向量化的好处？

能够有效对整个数据集进行处理，而无需明确的公式

3）怎么优化？

对于非常大的数据集时，向量化的计算速度很慢。因此，我们考虑将大数据集分成多个子集，再采用最小集梯度下降法计算

4）随机梯度细节？

有的batch的成本会高一些，使得cost函数出现震荡

5）选用一定大小batch的优点

1.可以得到大量的向量化（如果batch为1 ，就没有）

2.节省时间，不需要等待整个训练集本处理完就可以进行训练（近似进程池）

二.

指数加权平均数：

通过上述公式，我们可得：下一时刻与上一时刻间存在β的关系

因此，当β越大时，相邻时刻影响越大，总体曲线变化越平缓，例如（绿色），当β月小时，当前时刻影响越大，总体曲线变化越剧烈（容易出现异常值，但适应性越强），如（黄色）

算术平均（权重相等）—>加权平均（权重不等）—>移动平均（大约是只取最近的 N 次数据进行计算）—> 批量归一化(BN)及各种优化算法的基础
EMA：是以指数式递减加权的移动平均，各数值的加权影响力随时间呈指数式递减，时间越靠近当前时刻的数据加权影响力越大

因此，指数移动平均就是个时间内，进行一个权值更新

三.

做偏差修正，对输出化为0的数据早期进行止损

目标：在起始阶段的估计更加准确；当 t 很大时，偏差修正几乎没有作用，所以对原来的式子几乎没有影响

四.

Momentum

其中，β常为0.9

本质：1）减缓下降时水平梯度，提高垂直梯度，使其震荡较小，下降较快。

2）通过指数移动平均，来对梯度下降的方向进行纠正

五.（又名：均方根，）

提出了一种减缓水平方向震荡的新思路

即，dW天然要比dB小（权值范围为0-1间），那么我们可以使得W的更新大于偏移（b）的更新，从而使得震动变小

六.

本质：Momentum更新了超参数β1（称第一矩），RMSprop更新了超参数β2（称第二矩），在他们基础上加上一段时间的偏差纠正，便是Adam

β1 常用值： 0.9 β2作者推荐：0.999

猜你喜欢

转载自blog.csdn.net/weixin_38740463/article/details/89016517

吴恩达心得

（一）吴恩达-机器学习第一课学习心得

（二）吴恩达-机器学习第二课学习心得-线性回归算法（Linear regression）

（三）吴恩达-机器学习第三课学习心得-矩阵和向量

吴恩达 octave

吴恩达深度学习第一课第四周作业及学习心得体会

吴恩达深度学习第二课第二周作业及学习心得体会——minibatch、动量梯度下降、adam

吴恩达深度学习第一课第三周作业及学习心得体会

吴恩达机器学习

机器学习——吴恩达

吴恩达--降维

吴恩达--异常检测

吴恩达课堂笔记

吴恩达深度学习

吴恩达机器学习

Convolution model by吴恩达

机器学习吴恩达

吴恩达《机器学习》

吴恩达：AI的机会

吴恩达深度学习第二课第一周作业及学习心得体会——初始化权重、L2正则化、dropout

吴恩达深度学习教程

吴恩达深度学习课程笔记

吴恩达机器学习笔记（一）

吴恩达机器学习 - 逻辑回归

吴恩达机器学习 - 正规函数

吴恩达机器学习笔记（十二）

吴恩达机器学习笔记（八）

吴恩达机器学习笔记（七）

吴恩达机器学习笔记（六）

吴恩达机器学习笔记（五）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)