简析梯度下降法的数学原理 - 代码天地

简析梯度下降法的数学原理

其他 2018-08-28 12:11:26 阅读次数: 0

在机器学习领域的大部分算法中，最终求解损失函数的极值几乎都是基于梯度下降法。这个在数学上是如何求解出来的？

参考资料：https://web.stanford.edu/class/ee364b/lectures/stoch_subgrad_slides.pdf
（第20页）

设损失函数 $f(x)$ 是二阶可导的, 优化问题即为求解

a r g m i n x \in R d f (x)

$\underset{x\in\mathbb{R}^d}{argmin}f(x)$
设

xt $x^t$ 为第

t $t$ 次更新之后的变量值，由以下Taylor展开公式：

f (y) \approx f (x t) + \nabla f (x t) T (y - x t) + L t 2 ∥ y - x t ∥ 2

$f(y) \approx f(x^t)+\nabla f(x^t)^T(y-x^t)+\frac{L_t}{2}\|y-x^t\|^2$
因此，第

t+1 $t+1$ 步的变量值应由下式得到：

x t + 1 = a r g m i n y \in R d {f (x t) + \nabla f (x t) T (y - x t) + L t 2 ∥ y - x t ∥ 2}

$x^{t+1}=\underset{y\in\mathbb{R}^d}{argmin}\left\{f(x^t)+\nabla f(x^t)^T(y-x^t)+\frac{L_t}{2}\|y-x^t\|^2\right\}$
等价于：

x t + 1 = a r g m i n y \in R d {∥ ∥ ∥ \nabla f ( x t ) L t ∥ ∥ ∥ 2 + 2 \nabla f ( x t ) T L t (y - x t) + ∥ y - x t ∥ 2}

$x^{t+1}=\underset{y\in\mathbb{R}^d}{argmin}\left\{\left\| \frac{\nabla f(x^t)}{L_t}\right\|^2+2\frac{\nabla f(x^t)^T}{L_t}(y-x^t)+\|y-x^t\|^2\right\}$

x t + 1 = a r g m i n y \in R d ⎧ ⎩ ⎨ ∥ ∥ ∥ ∥ y - (x t - \nabla f ( x t ) L t) ∥ ∥ ∥ ∥ 2 ⎫ ⎭ ⎬

$x^{t+1}=\underset{y\in\mathbb{R}^d}{argmin}\left\{\left\|y-\left(x^t-\frac{\nabla f(x^t)}{L_t}\right)\right\|^2\right\}$

因此，

x t + 1 = x t - α t \nabla f (x t), α t = L - 1 t .

$x^{t+1}=x^t-\alpha_t\nabla f(x^t), ~~\alpha_t = L^{-1}_t .$

猜你喜欢

转载自blog.csdn.net/ljyt2/article/details/78672826

简析梯度下降法的数学原理

【Algorithm】梯度下降算法的数学原理

梯度下降背后的数学原理几何？

梯度下降法原理

数学基础-梯度下降法

梯度下降法原理及实现

梯度下降法(SGD)原理

梯度下降算法简单理解：一阶泰勒展开式，梯度下降数学原理

回归与梯度下降法及实现原理

深度解析梯度下降法的原理

梯度下降法基本原理

梯度下降法原理和实现

梯度与梯度下降法

【机器学习】【高等数学】梯度与梯度下降法

梯度下降法总结

梯度下降法

最速梯度下降法

梯度下降法——专题

理解梯度下降法

梯度下降法详解

关于梯度下降法

梯度下降法描述

AI 梯度下降法

梯度下降法总结

梯度下降法(GradientDecsent)

多元梯度下降法

梯度下降法深入

梯度下降法实例

［笔记］梯度下降法

浅谈梯度下降法

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)