李宏毅深度学习笔记（二）随机梯度下降(Stochastic Gradient Descent) - 代码天地

李宏毅深度学习笔记（二）随机梯度下降(Stochastic Gradient Descent)

其他 2020-01-11 00:29:46 阅读次数: 0

已知损失函数为：

$L=\sum_{j=1}^n(\hat y^j-(b+\sum_{i=1}^{m}w_ix_i^j))^2$ ·············································(1)

$n$ 代表样本的个数， $m$ 代表特征的个数。

$\bullet$ 一般的梯度下降(Gradient Descent)：

$\theta^i=\theta^{i-1}-\eta\nabla L(\theta^{i-1})$ ··································································(2)

$\bullet$ 随机梯度下降(Stochastic Gradient Descent):

只取其中一个样本

$L^j=(\hat y^j-(b+\sum_{i=1}^mw_ix_i^j))^2$ ······················································(3)

$\theta^i=\theta^{i-1}-\eta \nabla L^j(\theta^{i-1})$

下图是随机梯度下降法与一般的梯度下降的比较：

在这里插入图片描述
优点：
（1）由于不是在全部训练数据上的损失函数，而是在每轮迭代中，随机优化某一条训练数据上的损失函数，这样每一轮参数的更新速度大大加快。
缺点：
（1）准确度下降。由于即使在目标函数为强凸函数的情况下，SGD仍旧无法做到线性收敛。
（2）可能会收敛到局部最优，由于单个样本并不能代表全体样本的趋势。
（3）不易于并行实现。

comli_cn

发布了26 篇原创文章 · 获赞 11 · 访问量 1535

私信关注

猜你喜欢

转载自blog.csdn.net/comli_cn/article/details/102955326

李宏毅深度学习笔记（二）随机梯度下降(Stochastic Gradient Descent)

随机梯度下降 Stochastic Gradient Descent(SGD)

The Gradient Descent---梯度下降（Gradient Descent）

机器学习-随机梯度下降（Stochastic gradient descent）和批量梯度下降（Batch gradient descent ）

梯度下降（Gradient Descent）

梯度下降 — Gradient Descent

梯度下降 Gradient Descent

台大李宏毅--梯度下降Gradient Descent

李宏毅机器学习笔记-3 梯度下降（Gradient Descent）

机器学习之SGD（Stochastic Gradient Descent，随机梯度下降）

Learning to learn by gradient descent by gradient descent 笔记

Stochastic Gradient Descent

（二）梯度下降(Gradient Descent)

梯度下降（Gradient Descent）（二）

Gradient Descent (二)

3、【李宏毅机器学习（2017）】Gradient Descent（梯度下降）

梯度下降（Gradient Descent）小结

梯度下降法 Gradient Descent

深入梯度下降(Gradient Descent)

3、Gradient Descent（梯度下降）

梯度下降（Gradient Descent）（一）

梯度下降（Gradient Descent）（三）

梯度下降法(Gradient descent)

梯度下降算法（Gradient Descent)

梯度下降（gradient descent）原理

Gradient Descent：梯度下降法

梯度下降（Gradient Descent）法

梯度下降算法(Gradient descent)

随机梯度下降法（Stochastic gradient descent, SGD）

详解随机梯度下降法（Stochastic Gradient Descent，SGD）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)