TensorFlow 神经网络优化：指数衰减学习率、滑动平均、正则化 - 代码天地

TensorFlow 神经网络优化：指数衰减学习率、滑动平均、正则化

其他 2020-06-23 10:18:11 阅读次数: 0

1. 指数衰减学习率

tf.train.exponential_decay

先使用较大的学习率快速得到一个较优解，然后随着迭代逐步减小学习率，使模型在训练后期更加稳定。
$decayed\_learning\_rate = learning\_rate * decay\_rate ^{\frac{global\_step}{ decay\_steps}}$

global_step = tf.Variable(0,trainable=False)
learning_rate  = tf.train.exponential_decay(learning_rate, global_step, decay_steps, decay_rate, staircase=False)
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost,global_step = global_step)

2. 滑动平均

tf.train.ExponentialMovingAverage

滑动平均记录了一段时间内模型中所有参数 $w$ 和 $b$ 各自的平均值。利用滑动平均值可以增强模型的泛化能力。
$shadow\_variable = decay \times shadow\_variable + (1-decay) \times variable$ 其中， $shadow\_variable$ 为影子变量， $variable$ 为待更新的变量， $decay$ 为衰减率。 $decay$ 决定了模型的更新速度， $decay$ 越大，模型越趋于稳定。实际应用中，一般设定为接近1的数（如0.999或0.9999）。为了使模型在训练前期可以更新的更快，ExponentialMovingAverage还提供了num_updates参数设置 $decay$ 的大小：
$\min \{ decay, \frac{1+num\_updates}{10+1+num\_updates} \}$ 使用如下：

variable_averages = tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECCAY,global_step)
variable_averages_op = variable_averages.apply(tf.trainable_variables())
with tf.control_dependencies([optimizer,variable_averages_op]):
        train_op= tf.no_op(name = 'train')

3. 正则化

Tensorflow提供了

tf.contrib.layers.l1_regularizer
tf.contrib.layers.l2_regularizer

来计算给定参数的L1/L2正则化项的值。

使用如下：

regularizer = tf.contrib.layers.l2_regularizer(REGULARIZER_RATE) 
tf.add_to_collection('losses',regularizer(W1))
tf.add_to_collection('losses',regularizer(W2))
cem = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits = Y_, labels = Y))
cost = cem + tf.add_n(tf.get_collection('losses'))

猜你喜欢

转载自blog.csdn.net/apr15/article/details/106244851

TensorFlow 神经网络优化：指数衰减学习率、滑动平均、正则化

Tensorflow笔记——神经网络图像识别（四）搭建模块化的神经网络八股（正则化，指数衰减学习率，滑动平均等优化）

tensorflow-正则化+指数衰减+滑动平均

tensorflow随笔-正则化+指数衰减+滑动平均

TensorFlow笔记-07-神经网络优化-学习率,滑动平均

tensorflow-正则化与指数衰减率

tensorflow随笔-正则化与指数衰减率

吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用指数衰减的学习率

神经网络优化之滑动平均（tensorflow）

tensorflow笔记神经网络优化之滑动平均

TensorFlow之DNN（二）：全连接神经网络的加速技巧(Xavier初始化、Adam、Batch Norm、学习率衰减与梯度截断) TensorFlow之DNN（一）：构建“裸机版”全连接神经网络》深度学习之激活函数》深度学习之Batch Normalization 深度学习之优化算法深度学习之正则化方法

【tensorflow】】模型优化（一）指数衰减学习率

tensorflow 随笔－－－－－－－－－指数衰减和平均和滑动平均

TensorFlow笔记之神经网络优化——学习率

神经网络优化之学习率的设置（tensorflow）

神经网络优化-----学习率（指数衰减学习率）

【Tensorflow与深度学习笔记day10】5.5. 网络优化改进+指数衰减学习率exponential_decay+使用

Tensorflow之神经网络学习率

人工智能实践：Tensorflow笔记 # 5 神经网络优化：滑动平均

神经网络优化：指数衰减计算平均值(滑动平均)

tensorflow学习之---------------学习率指数衰减法

Tensorflow学习：（三）神经网络优化

Tensorflow学习之神经网络优化

tensorflow学习笔记------神经网络优化

吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用滑动平均

TensorFlow 神经网络优化

TensorFlow神经网络优化

机器学习之路：深度学习 tensorflow 神经网络优化算法学习率的设置

TensorFlow入门：学习率衰减

TensorFlow笔记--学习率衰减

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)