【动手学习深度学习-----优化算法笔记】

编程语言 2023-04-06 14:02:02 阅读次数: 0

优化和深度学习

优化算法的目标函数通常是基于训练数据集的损失函数，因此优化的目标是减少训练误差。

深度学习中的优化挑战

1.局部最小值

深度学习模型的目标函数通常有许多局部最优解。当优化问题的数值解接近局部最优值时，随着目标函数解的梯度接近或变为零，通过最终迭代获得的数值解可能仅使目标函数局部最优，而不是全局最优。只有一定程度的噪声可能会使参数超出局部最小值。事实上，这是小批量随机梯度下降的有利特性之一，在这种情况下，小批量上梯度的自然变化能够将参数从局部极小值中移出。
在这里插入图片描述

2.鞍点

鞍点（saddle point）是指函数的所有梯度都消失但既不是全局最小值也不是局部最小值的任何位置。
在这里插入图片描述
Hessian矩阵：设有凸函数f(X)，X是向量（x1,x2,…, xn)，Hessian矩阵M定义为：一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵，也就是说M的第i行,第j列元素为df(X)/dxidxj, 即为f(X)对于变量xi和xj的二次偏导数。

当函数在零梯度位置处的Hessian矩阵的特征值全部为正值时，我们有该函数的局部最小值。
当函数在零梯度位置处的Hessian矩阵的特征值全部为负值时，我们有该函数的局部最大值。
当函数在零梯度位置处的Hessian矩阵的特征值为负值和正值时，我们对函数有一个鞍点。

对于高维度问题，至少部分特征值为负的可能性相当高。这使得鞍点比局部最小值更有可能。简而言之，凸函数是Hessian函数的特征值永远不是负值的函数。

梯度消失

这时候梯度接近于0
在这里插入图片描述

凸性

虽然深度学习中的优化问题通常是非凸的，它们也经常在局部极小值附近表现出一些凸性。
这一节看书吧。。

猜你喜欢

转载自blog.csdn.net/qq_33950926/article/details/122997548

【动手学习深度学习-----优化算法笔记】

动手学深度学习（九、深度学习优化算法）

动手学深度学习之优化算法进阶

动手学习深度学习 | 笔记汇总

【动手学习深度学习笔记】

《动手学深度学习》笔记 Task07：优化算法进阶；word2vec；词嵌入进阶

【李沐-动手深度学习v2】笔记整理-08线性回归+基础优化算法

动手学深度学习笔记--autograd

动手学深度学习笔记---ndarray

《动手学深度学习笔记》

[深度学习]动手学深度学习笔记-5

[深度学习]动手学深度学习笔记-2

[深度学习]动手学深度学习笔记-8

[深度学习]动手学深度学习笔记-7

[深度学习]动手学深度学习笔记-10

[深度学习]动手学深度学习笔记-4

[深度学习]动手学深度学习笔记-6

[深度学习]动手学深度学习笔记-3

[深度学习]动手学深度学习笔记-1

[深度学习]动手学深度学习笔记-12

[深度学习]动手学深度学习笔记-11

[深度学习]动手学深度学习笔记-9

[深度学习]动手学深度学习笔记-15

[深度学习]动手学深度学习笔记-14

[深度学习]动手学深度学习笔记-13

深度学习结课总结和进阶学习优化算法动手学深度学习v2

动手学深度学习v2__08线性回归 + 基础优化算法

线性回归 + 基础优化算法动手学深度学习v2 pytorch

凸优化-《动手学深度学习pytorch》

《动手学深度学习》学习笔记（一）

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)