经典数值优化算法--专题学习 - 代码天地

经典数值优化算法--专题学习

其他 2018-10-15 08:23:45 阅读次数: 0

通用的损失函数最优化的数值方法，来源于泰勒展开式，多元函数的泰勒展开式为：

一、一阶逼近与一阶方法

一阶泰勒展开式：

其中，是代表了β变化的可能性，t在之后说到的梯度下降方法中演变成了学习速率。

现在，我们需要第二项最小，向量内积，最小为-|梯度||a|，这就是β的改变量。梯度的方向是函数在给定点上升最快的方向，那么梯度的反方向就是函数在给定点下降最快的方向，这正是我们所需要的。所以我们只要沿着梯度的方向一直走，就能走到局部的最低点！

于是，演变成了：

倒三角符号就是梯度。梯度是函数关于每一个自变量的偏导组成的向量。物理意义就是一个在站在某一个点上，斜率最大的那个方向。（最常见的就是二维平面上曲线的斜率）。

二、二阶逼近与牛顿法

对损失函数进行二阶展开：

损失函数取得最小值的必要条件是：

最后得到β的迭代公式：

牛顿法需要用到Hessian矩阵，是损失函数的二阶导数组成的矩阵。于是上面的公式就变成了：

牛顿法要求Hessian矩阵必须是非负定的，才能求解出局部最小值。。

ps：当Hessian矩阵非正定时，收敛到局部最大值，不定时，收敛到鞍点。

另外，如果Hessian矩阵是病态的（求解方程组时如果对数据进行较小的扰动，则得出的结果具有很大波动，这样的矩阵称为病态矩阵。用条件数来衡量，矩阵A的条件数：K(A)=‖A^-1‖*‖A‖。若K很大的时候，A为病态矩阵），需要通过正则化来处理，求伪逆。则损失函数的参数更新方程：

猜你喜欢

转载自www.cnblogs.com/melina-zh/p/9789036.html

经典数值优化算法--专题学习

专题学习——LCT

专题学习——计算几何

源码专题学习大纲

Android专题学习之——多线程

[转][专题学习] [计算几何]

性能调优专题学习大纲

微服务专题学习大纲

分布式专题学习大纲

工程化专题学习大纲

构造专题学习笔记QAQ

Python模块EasyGui专题学习

hash专题学习笔记QAQ

Spring Security OAuth专题学习-背景

zookeeper专题学习(四)-----zookeeper应用

iOS 开发专题学习资源分类大全

C语言高级专题学习笔记-函数指针实战

iReport专题学习之组(Group)06

iReport专题学习之变量、栏05

iReport专题学习之字段、参数04

iReport专题学习之报表元素03

iReport专题学习之报表结构02

iReport专题学习之入门简介01

Java反射专题学习之获取方法的信息

Java反射专题学习-动态类的加载

Java反射专题学习-类的创建及初步认识

Java反射专题学习-获取类的构造信息

Spring Security OAuth专题学习-密码模式JWT实现

莫比乌斯反演专题学习笔记

钟馗之眼导航，探索与专题学习与分析

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)