最优化问题之如何逃离(跳出)鞍点（Saddle Points） - 代码天地

最优化问题之如何逃离(跳出)鞍点（Saddle Points）

其他 2018-10-05 21:45:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/BVL10101111/article/details/78051939

看了点鞍点相关的知识，做一下备录。

我们知道在，优化问题中，深度学习的优化问题中，经常存在鞍点，就是这一点的导数为0，从某些维度看是极小值，从另一些维度看是极大值，比如：

这里写图片描述

深度学习的寻优过程中，鞍点所造成的困难，远比局部最小值大的多，因为

1）在高维参数空间，鞍点存在较多
2）大量工作表面局部最优解，对于模型而言已经足够好。

此外，正是因为深度学习中鞍点的大量存在，传统的牛顿法不适合，来寻优，因为牛顿法是通过直接寻找梯度为0的点，来寻优的,那么极有可能陷入鞍点。
（ps: 也正因为如此，牛顿法在Hessian为正定的时候，比梯度下降速度快，因为牛顿法直接找梯度为0 的点，而梯度下降则是一次一次的寻找当前点的最优梯度）

那么如何逃离，跳出鞍点呢？

1）利用Hessian矩阵，判断是否为鞍点，因为，Hessian在鞍点具有正负特征值，而在局部最小值点正定。

2）随机梯度，相当于给正确的梯度加了一点noise，一定程度上避免了鞍点（但是只是一定程度）,达到类似于如下公式的效果

3）随机初始化起点，也有助于逃离鞍点，原因见here

4）增加偶尔的随机扰动，详见here

上一张各算法逃离鞍点的效果图，有一个直观的感觉：

这里写图片描述

最后，推荐大家看这两篇博客，帮助大家理解：

Escaping from Saddle Points

猜你喜欢

转载自blog.csdn.net/BVL10101111/article/details/78051939

最优化问题之如何逃离(跳出)鞍点（Saddle Points）

python之entry points

points

leetcode之Max Points on a Line

论文笔记之CenterNet：Objects as Points

时间转换报java.lang.NumberFormatException: multiple points问题

1000C. Covered Points Count（线段覆盖问题）

java.lang.NumberFormatException: multiple points错误问题

C. Covered Points Count (线段问题---差分、排序)

暑假训练6之Visible Lattice Points（欧拉函数）

Crack LeetCode 之 149. Max Points on a Line

OpenLayers官方示例详解十六之伪造点（Synthetic Points）

OpenLayers官方示例详解十七之伪造线（Synthetic Points）

Mayavi入门之mlab.points3d

（三）论文阅读 | 目标检测之CenterNet-Points

Interview Points

Points of ConcurrentHashMap

Attention Points

check points

Points in Segments

multiple points

Cover Points

The Moving Points

Match Points

Circle and Points

Moving Points

Codeforces Round #319 (Div. 2) E. Points on Plane 莫队+优化

[问题]You must specify at least three points for the robot footprint,reverting to previous footprint 的

CodeForces 1000C Covered Points Count（区间线段覆盖问题，差分）

idea配置jdk出现的问题The selected directory points to a JRE, not a JDK.

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)