优化函数（Optimization Function） - 代码天地

优化函数（Optimization Function）

其他 2020-05-25 11:14:56 阅读次数: 0

在利用损失函数（Loss Function）计算出模型的损失值之后，接下来需要利用损失值进行模型参数的优化。在实践操作最常用到的是一阶优化函数。包括GD，SGD，BGD，Adam等。一阶优化函数在优化过程中求解的是参数的一阶导数，这些一阶导数的值就是模型中参数的微调值。

1.梯度下降

梯度下降（Gradient Descent）是参数优化的基础方法。虽然已广泛应用，但是其自身存在许多不足，所以在其基础上改进的优化函数也非常多。

全局梯度下降的参数更新公式如下：

$\theta_{j}=\theta_{j}-\eta \times \frac{\partial J\left(\theta_{j}\right)}{\partial \theta_{j}}$

其中，训练样本总数为 $n,j=0....n$ 。 $\theta$ 是我们优化的参数对象， $\eta$ 是学习速率， $J(\theta )$ 是损失函数，后面的求导是根据损失函数来计算 $\theta$ 的梯度。学习速率过快，参数的更新跨步就会变大，极易出现局部最优和抖动。学习率过慢，梯度更新的迭代次数就会增加，参数更新时间也会变长。

缺点：计算损失值的时间成本和模型训练过程中的复杂度增加。

2.批量梯度下降

假设划分出来的批量个数为m，其中的一个批量包含batch个数据样本，那么一个批量的梯度下降的参数更新公式如下：

$\theta_{j}=\theta_{j}-\eta \times \frac{\partial J_{b a c h}\left(\theta_{j}\right)}{\partial \theta_{j}}$

缺点：容易导致优化函数的最终结果是局部最优解。

3.随机梯度下降：

假设我们随机选取的一部分数据集包含stochastic个数据样本，那么随机梯度下降的参数更新公式如下：

$\theta_{j}=\theta_{j}-\eta \times \frac{\partial J_{\text {stochastic}}\left(\theta_{j}\right)}{\partial \theta_{j}}$

缺点：会在模型的参数优化过程中出现抖动的情况。

4.Adam

一个比较智能的优化函数方法--自适应时刻估计方法（Adaptive Moment Estimation）。它在模型训练优化的过程中通过让每个参数获得自适应的学习率，来达到优化质量和速度的双重提升。现在一般都选择用这个方法。

。。。。。。等等

参考：

PyTorch学习之十种优化函数

深度学习各种优化函数详解

猜你喜欢

转载自blog.csdn.net/Frank_LJiang/article/details/104269899

优化函数（Optimization Function）

Deep Learning, Score function, Loss function 和 optimization function（三）

Deep Learning, Score function, Loss function 和 optimization function（二）

Deep Learning, Score function, Loss function 和 optimization function（一）

Optimization-优化

优化算法optimization：RMSProp

优化算法optimization：AdaDelta

优化算法optimization：AdaGrad

优化算法optimization：Adam

约束优化方法(Constrained Optimization )

7.3 Constrained optimization (条件优化)

Deepstream Performance Optimization 性能优化

MATLAB - 凸优化（Convex Optimization）

optimization

函数 function

函数(function)

函数（Function）

function（）函数

function函数

function 函数

立即执行函数: (function(){...})() 与 (function(){...}())

立即执行函数: (function ( ){...})( ) 与 (function ( ){...}( ))

SMO优化算法（Sequential minimal optimization）

贝叶斯优化 Bayesian Optimization

1. Introduction and optimization problems（优化问题）

空白基类优化 ( Empty base optimization )

CS231n 优化 optimization

资产组合优化原理与实例 Portfolio Optimization

Redis内存优化memory-optimization

数值优化（Numerical Optimization）学习系列-目录

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)