梯度下降法 Gradient Descent - 代码天地

梯度下降法 Gradient Descent

其他 2018-07-31 18:17:32 阅读次数: 0

梯度下降法求解最小值过程概述：
在一个可微的光滑曲面上随机选取一个点，然后通过不断的迭代计算，使这个点移动的每一步都向着梯度方向(即下降最快的方向)，最终到达局部极小值点，之后通过多次随机取点进行同样的计算，即可找出最小值点。
这里写图片描述

那么我们为什么不直接求解最小值点，而是通过迭代的方法一步一步来求解呢？

实际上机器学习所要求的非线性方程一般很难求得数值解，而且在实际应用中也没有必要求得精确的数值解，往往只要求得满足一定精度要求的近似解即可。计算模型的过程是一个拟合的过程，通过不断迭代缩小误差来得到近似解，最终误差在一个可接受的范围内就算拟合完成。

举个例子，假设我们要寻找一个小于10的误差在2以内的数，那么通过迭代我们可以得到9或9.5甚至更接近(因为迭代的过程是一个不断减小误差的过程)，但是直接求解我们很有可能只能找到8，这时候误差就很大了。

梯度下降法的数学表达：
假设 $f(x)$ 是 $R^n$ (n维特征空间)上具有一阶连续偏导数的函数，要求解的无约束最优化函数如下：

min_{x \in R^{n}} f (x)

$\min_{x \in R^n}f(x)$ 则有：
目标函数(损失函数+正则化项)：

f (x)

$f(x)$
梯度函数：

g (x) = \nabla f (x)

$g(x) = \nabla f(x)$
给定精度：

ϵ

$\epsilon$
给定步长：

η

$\eta$
下降距离：

η g

$\eta g$
极小值点：

x^{*}

$x^*$

计算步骤：

取初始值 $x^{(k)} \in R^n$ ，置 $k$ 为0；
计算 $f(x^{(k)})$ ；
计算梯度 $g_k = g(x^{(k)})$ 。当 $g_k < \epsilon$ 时，停止迭代，令 $x^* = x^{(k)}$ 。否则求 $\eta_k$ 使得： $f (x^{(k)} - η_{k} g_{k}) = min_{η ⩾ 0} f (x^{(k)} - η_{k} g_{k})$ $f(x^{(k)}-\eta_k g_k) = \min_{\eta \geqslant 0}f(x^{(k)}-\eta_k g_k)$
令 $x^{(k+1)} = x^{(k)}-\eta_k g_k$ ，计算 $f(x^{(k+1)})$ ；
如果 $||f(x^{(k+1)}) - f(x^{(k)})|| \leqslant \epsilon$ 或者 $||x^{(k+1)} - x^{(k)}|| \leqslant \epsilon$ ，则停止迭代，令 $x^* = x^{(k+1)}$ 。否则，转到第三步。

猜你喜欢

转载自blog.csdn.net/baishuiniyaonulia/article/details/80948499

梯度下降法 Gradient Descent

梯度下降法(Gradient descent)

Gradient Descent：梯度下降法

Machine Learning：Gradient Descent（梯度下降法）

Gradient descent algorithm 梯度下降法

梯度下降法(Gradient Descent)初识

梯度下降法Gradient_descent

全是干货的梯度下降法（Gradient descent）

ML重要概念：梯度（Gradient）与梯度下降法（Gradient Descent）

梯度下降（Gradient Descent）

梯度下降 — Gradient Descent

梯度下降 Gradient Descent

The Gradient Descent---梯度下降（Gradient Descent）

梯度下降法Gradient descent（最速下降法Steepest Descent）

梯度下降法（Gradient Descent）推导和示例

机器学习之梯度下降法(Gradient Descent)

机器学习入门 04 梯度下降法（Gradient Descent）

机器学习算法之_梯度下降法（Gradient Descent）

随机梯度下降法（Stochastic gradient descent, SGD）

详解随机梯度下降法（Stochastic Gradient Descent，SGD）

梯度下降（Gradient Descent）小结

（二）梯度下降(Gradient Descent)

3、Gradient Descent（梯度下降）

深入梯度下降(Gradient Descent)

梯度下降（Gradient Descent）（三）

梯度下降（Gradient Descent）（二）

梯度下降（Gradient Descent）（一）

梯度下降算法（Gradient Descent)

梯度下降（gradient descent）原理

梯度下降（Gradient Descent）法

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)