Tensorflow入门——影子变量（shadow_variable）如何影响训练过程 - 代码天地

Tensorflow入门——影子变量（shadow_variable）如何影响训练过程

其他 2020-01-12 22:40:33 阅读次数: 0

滑动平均模型公式：
$shadow\_variable=decay\times shadow\_variable+(1-decay)\times variable$
上式 $shadow\_variable$ 的初值是相应模型变量的初始值，用来保存更新过程中变量的滑动平均值， $variable$ 是待更新的变量新值，显然，衰减率 $decay$ 越大，影子变量更新越慢。

今天看有些博客提到：模型变量和其影子变量不会直接相互赋值，博客评论也有“那么影子变量如何在实际训练中起作用”的疑问。
博主查阅了《Tensorflow实战Google深度学习框架（第2版）》，找了个使用滑动平均模型的代码好好分析了下，发现代码中有如下部分：

if avg_class = None:	# 如果不使用滑动平均模型
	layer1 = tf.nn.relu(tf.matual(input_tensor, weights1) + biases1)
	……
else:	# 如果使用滑动平均模型
	layer1 = tf.nn.relu(tf.matual(input_tensor, avg_class.average(weights1)) + biases1)	# avg_class.average(weights1)是weights1的滑动平均值
	……

我只截取了关键部分，可见，“模型变量和其影子变量不会直接相互赋值”的意思似乎是：影子变量仅用来保存变量的滑动平均值，如果不使用滑动平均模型，就取变量自身的值；如果想使用滑动平均模型，就取其影子变量的值（上述代码使用avg_class.average()来取某变量的滑动平均值，这个值应该是用影子变量来保存的）。

以上。如果大家认为我说的不对，欢迎指正。

umbrellalalalala

发布了36 篇原创文章 · 获赞 41 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/umbrellalalalala/article/details/86513958

Tensorflow入门——影子变量（shadow_variable）如何影响训练过程

Batch Size大小对训练过程的影响

tensorflow训练过程的日志与监控

Tensorflow 保存和载入训练过程

Tensorflow——可视化训练过程

TensorFlow入门教程：13：训练过程的可视化分析

tensorflow在训练过程中逐步减少学习率

tensorflow笔记：模型的保存与训练过程可视化

matplotlib实现TensorFlow训练过程的可视化

tensorflow训练过程中内存溢出

TensorFlow详解猫狗识别（三）--训练过程

Tensorflow 3. 训练过程，出现loss=NAN的问题？

Tensorflow训练过程中查看某参数的值

手动实现TensorFlow的训练过程：示例

从零开始的TensorFlow入门指南：构建第一个模型并可视化训练过程

tensorflow入门2-声明变量Variable

训练过程--GPU训练

训练过程--训练过程的指导性大纲

TensorFlow学习笔记（四）：Tensorflow网络构建和TensorBoard进行训练过程可视化

Tensorflow学习笔记6：解决tensorflow训练过程中GPU未调用问题

训练过程--fineturn微调

bert训练过程3

线性模型训练过程

训练过程Trick合集

『ignite』模型的训练过程

torch之训练过程

Tensorflow中Variable变量

tensorflow变量——Variable

TensorFlow之变量(Variable)

tensorflow Variable变量

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)