数值梯度(Numerical Gradient)

其他 2019-04-01 10:11:11 阅读次数: 0

数值梯度（Numerical Gradient）

数值梯度是对梯度的估计值，数值梯度在基于梯度下降的学习任务中可以用来检测计算梯度的代码是否正确，尽管当前而言各种autodiff框架早已保证了梯度的准确性，但是我就是想写你管我啊

常见的数值梯度形式有以下两种，利用泰勒展式可以证明其精度

Difference quotient¹

$\dfrac{f(x+h)-f(x)}{h}$
其误差为 $O(h)$ ，证明过程如下²
$\begin{aligned} &f(x+h)=f(x)+f'(x)h+O(h^2)\\ \Rightarrow \ &f'(x)h=f(x+h)-f(x)+O(h^2)\\ \Rightarrow \ &f'(x)=\dfrac{f(x+h)-f(x)}{h}+O(h) \end{aligned}$

Symmetric difference quotient

$\dfrac{f(x+h)-f(x-h)}{2h}$
其误差为 $O(h^2)$ ，证明过程如下²
$\begin{aligned} &f(x+h)=f(x)+f'(x)h+f''(x)h^2+O(h^3)\\ &f(x-h)=f(x)-f'(x)h+f''(x)h^2+O(h^3)\\ &f(x+h)-f(x-h)=2f'(x)h+O(h^3)\\ \Rightarrow \ &f'(x)= \dfrac{f(x+h)-f(x-h)}{2h}+O(h^2) \end{aligned}$

关于大O记号

数学上，当存在 $L$
$\dfrac{f(x)}{g(x)}\leq L \ (x\rightarrow x_0)$
时，记 $f(x)=O(g(x))$

猜你喜欢

转载自blog.csdn.net/luo3300612/article/details/88397033

数值梯度(Numerical Gradient)

The Gradient Descent---梯度下降（Gradient Descent）

梯度下降（Gradient Descent）

gradient checking（梯度检验）

梯度下降 — Gradient Descent

梯度下降 Gradient Descent

梯度检验 Gradient check

Gradient（梯度） of a scalar field

梯度累加(Gradient Accumulation)

ML重要概念：梯度（Gradient）与梯度下降法（Gradient Descent）

梯度消失（vanishing gradient）和梯度爆炸（exploding gradient）

梯度下降（Gradient Decent）与随机梯度下降（Stochastic Gradient Decent）

梯度下降（Gradient Descent）小结

梯度爆炸之Gradient Clipping

梯度下降法 Gradient Descent

（二）梯度下降(Gradient Descent)

3、Gradient Descent（梯度下降）

深入梯度下降(Gradient Descent)

梯度下降（Gradient Descent）（三）

梯度下降（Gradient Descent）（二）

梯度下降（Gradient Descent）（一）

梯度下降法(Gradient descent)

梯度下降算法（Gradient Descent)

opencv-图像梯度（gradient）

浅谈Matlab中的梯度（gradient）

梯度下降（gradient descent）原理

梯度提升（Gradient Boosting）算法

Gradient Descent：梯度下降法

梯度下降（Gradient Descent）法

pytorch 梯度累积（gradient accumulation）

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)