机器学习学习笔记（3）梯度下降 - 代码天地

机器学习学习笔记（3）梯度下降

其他 2018-08-11 05:17:16 阅读次数: 0

梯度下降法

梯度下降法是一种常用的一阶优化方法，是求解无约束优化问题最简单、最经典的方法之一。

梯度下降算法如下：

输入：目标函数 $f(x)$ ，梯度函数 $g(x)=\nabla f(x)$ ，计算精度 $\varepsilon$ ：

输出： $f(x)$ 的极小点 $x^*$

（1）取初始值 $x^{(0)}\in \bold R^n$ ，置为k=0

（2）计算 $f(x^{(k)})$

（3）计算梯度 $g_k=g(x^{(k)})$ ，当 $||g_k||<\varepsilon$ 时，停止迭代，令 $x^*=x^{(k)}$ ，否则，令 $p_k=-g(x^{(k)})$ ，求 $\lambda _k$ ，使 $f(x^{(k)}+\lambda _kp_k)=\min \limits_{\lambda \geqslant 0}f(x^{(k)}+\lambda p_k)$

（4）令 $x^{(k+1)}=x^{(k)}+\lambda _kp_k$ ，计算 $f(x^{(k+1)})$ ，当 $||f(x^{(k+1)})-f(x^{(k)})||< \varepsilon$ 或 $||x^{(k+1)}-x^{(k)}||< \varepsilon$ 时，停止迭代，令 $x^*=x^{(k+1)}$

（5）否则，令k=k+1，转（3）

当目标函数是凸函数时，梯度下降法的解释全局最优解，一般情况下，其解不保证是全局最优解，梯度下降法的收敛速度也未必是很快的。

基于梯度的搜索是使用最为广泛的参数寻优方法，但是会陷入局部极小。

扫描二维码关注公众号，回复： 2686616 查看本文章

批量梯度下降法（Batch Gradient Descent，简称BGD）

批量梯度下降法是梯度下降法最原始的形式，它的具体思路是在更新每一参数时都使用所有的样本来进行更新。

在整个数据集上（求出罚函数 J(θ 并）对每个参数 θ 求目标函数 J(θ) 的偏导数：

优点：全局最优解，易于并行实现

缺点：训练过程慢，对于较大的内存无法容纳的数据集，该方法否无法被使用

随机梯度下降法（Stochastic Gradient Descent）

在每次更新参数时，随机选取一个样本，计算惩罚函数，然后求出相应的偏导数：

优点：训练速度快

缺点：SGD收敛过程中存在波动，会帮助跳出局部极小值，会让收敛到特定最小值的过程复杂化，因为该方法可能持续波动而不收敛，当慢慢降低学习率时，SGD和BGD表现出了相似的收敛过程。

小批量梯度下降法（Mini-Batch Gradient Descent）

更新每一参数时，使用一部分样本来更新，对n个样本构成的一批数据，计算惩罚函数并求导：

这种方法能够降低更新参数的方差，使得收敛过程更加稳定，能够利用最新的深度学习程序库中高度优化的矩阵运算器，能够高效地求出每小批数据的梯度。

梯度下降的优化算法：

动量法
Nesterov 加速梯度法
Adagrad 法
Adadelta 法
RMSprop 法
Adam

对SGD进行平行计算或者分布式计算：

Hogwild!
Downpour SGD
容忍延迟的 SGD 算法
TensorFlow
弹性平均梯度下降法（Elastic Averaging SGD）

优化SHD的其它手段：

重排法（Shuffling）和递进学习（Curriculum Learning）
批量标准化（Batch Normalization）
早停（Early Stopping）
梯度噪声（Gradient Noise）

参考：

猜你喜欢

转载自blog.csdn.net/sxllllwd/article/details/81566640

机器学习-梯度下降

机器学习 - 梯度下降

机器学习--梯度下降

机器学习_梯度下降

机器学习：梯度下降

机器学习梯度下降

机器学习----梯度下降

机器学习学习笔记（3）梯度下降

机器学习笔记：梯度下降

梯度下降（学习笔记）

[机器学习]—梯度下降法

机器学习之梯度下降

机器学习---梯度下降算法

【机器学习】梯度下降算法

机器学习实战----梯度下降

机器学习——梯度下降算法

梯度下降（二）--机器学习

梯度下降（一）--机器学习

机器学习/梯度下降算法

机器学习梯度下降算法

机器学习——梯度下降法

[机器学习] 梯度下降算法

传统机器学习-梯度下降

机器学习--梯度下降法

【机器学习】梯度下降法

机器学习-梯度下降算法

机器学习---梯度下降代码

机器学习（3）——梯度下降法

机器学习笔记三：梯度下降

机器学习笔记6 - 梯度下降

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)