机器学习之路：深度学习 tensorflow 神经网络优化算法学习率的设置 - 代码天地

机器学习之路：深度学习 tensorflow 神经网络优化算法学习率的设置

其他 2018-06-07 16:47:46 阅读次数: 2

在神经网络中，广泛的使用反向传播和梯度下降算法调整神经网络中参数的取值。

梯度下降和学习率：

　　假设用 θ 来表示神经网络中的参数， J(θ) 表示在给定参数下训练数据集上损失函数的大小。

　　那么整个优化过程就是寻找一个参数θ，使得J(θ) 的值最小，也就是求J(θ) 的最小值

　　

　　损失函数J(θ)的梯度 = ∂ J(θ) / ∂ θ

　　此时定义一个学习率 η

　　梯度下降法更新参数的公式为： θ_n+1 = θ_n- η ( ∂ J(θ_n) / ∂ θ_n )

　　将这个公式循环的重复下去，θ的值就从高处逐渐向最低处一小步一小步的移动

举个例子：

　　使用梯度下降使得损失函数函数 J(x) = x²的值尽量小，由二次函数图像开口向上可以知道，二次函数最小值为0，

　　梯度 ▽ = ∂ J(x) / ∂ x = 2x

　　假设初始值为 x= 5, 设置学习率为0.3

　　使用梯度下降更新x的值步骤如下：

　　轮数　　　　　　当前参数x　　　　　　梯度 * 学习率　　　　　　更新后参数

　　1　　　　　　　　5 　　　　　　　　　　2*5*0.3 = 3　　　　　　5-3=2

　　2　　　　　　　　2　　　　　　　　　　2*2*0.3 = 1.2　　　　　 2-1.2 = 0.8

　　3　　　　　　　　0.8　　　　　　　　　2*0.8*0.3 = 0.48　　　　0.8-0.48 = 0.32

　　4　　　　　　　　0.32　　　　　　　　2*0.32*0.3 = 0.192　　　　0.32-0.192=0.128

　　5　　　　　　　　0.128 　　　　　　2*0.128*0.3=0.0768　　　0.128-0.0768=0.0512

　　经过五次迭代x从5变成了0.0512，已经和0非常接近了。

但是梯度下降并不能每次都能获得全局最优解。

特殊情况下如果学习率过小，可能会导致陷入局部最优解的情况。如图：

猜你喜欢

转载自www.cnblogs.com/Lin-Yi/p/9151391.html

机器学习之路：深度学习 tensorflow 神经网络优化算法学习率的设置

神经网络优化之学习率的设置（tensorflow）

TensorFlow学习笔记（六）——神经网络优化算法

深度学习神经网络优化算法

TensorFlow笔记之神经网络优化——学习率

tensorflow实战google深度学习框架阅读笔记——神经网络优化算法

Tensorflow学习：（三）神经网络优化

Tensorflow学习之神经网络优化

tensorflow学习笔记------神经网络优化

Tensorflow之神经网络学习率

【深度学习_2.2】神经网络之算法优化

学习《TensorFlow实战Google深度学习框架》（三）神经网络优化方法

深度学习网络__tensorflow__第四讲__神经网络优化

神经网络优化算法一（梯度下降、学习率设置）

TensorFlow 学习（五）：深度学习、神经网络

TensorFlow之DNN（二）：全连接神经网络的加速技巧(Xavier初始化、Adam、Batch Norm、学习率衰减与梯度截断) TensorFlow之DNN（一）：构建“裸机版”全连接神经网络》深度学习之激活函数》深度学习之Batch Normalization 深度学习之优化算法深度学习之正则化方法

吴裕雄 PYTHON 神经网络——TENSORFLOW 学习率的设置

Tensorflow学习三：神经网络的优化问题

神经网络学习9--tensorflow的优化器optimizer

tensorFlow学习（二）——神经网络梯度优化

TensorFlow学习总结（三）优化神经网络

【TensorFlow学习笔记】基础篇（五）— —神经网络的优化

深度学习编程笔记：Tensorflow2.1基础知识---神经网络参数优化器

TensorFlow笔记-07-神经网络优化-交叉熵，学习率

TensorFlow笔记-07-神经网络优化-学习率,滑动平均

人工智能实践：Tensorflow笔记 # 4 神经网络优化：学习率

TensorFlow 神经网络优化：指数衰减学习率、滑动平均、正则化

神经网络学习率设置

tensorflow笔记__学习率的设置

【深度学习】神经网络的优化方法

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)