tensorflow冻结部分层，只训练某一层 - 代码天地

tensorflow冻结部分层，只训练某一层

其他 2019-01-10 20:38:47 阅读次数: 0

其实常说的fine tune就是冻结网络前面的层，然后训练最后一层。那么在tensorflow里如何实现finetune功能呢？或者说是如何实现冻结部分层，只训练某几个层呢？可以通过只选择优化特定层的参数来实现该功能。示例代码如下：


#定义优化算子

optimizer = tf.train.AdamOptimizer(1e-3)

#选择待优化的参数

output_vars = tf.get_collection(tf.GraphKyes.TRAINABLE_VARIABLES, scope='outpt')

train_step = optimizer.minimize(loss_score,var_list = output_vars)

但是在这里，我却碰到了一个问题，关于adam的问题，如下：

Failed precondition: Attempting to use uninitialized value beta1_power

查了一下，这个参数应该是Adam优化算子里的参数。问题出在定义优化算子的时间，晚于参数初始化的时间，导致beta1_power没有初始化，修改一下代码（调整代码顺序即可）即如下的顺序：

sess.run(init)

train_step = optimizer.minimize(loss_score,var_list=output_vars)

改变成如下顺序即可

train_step = optimizer.minimize(loss_score,var_list=output_vars)

sess.run(init)

另外一个问题是，在用finetune的时候，发现速度并没有比retrain的速度快太多。分析原因在于finetune的时候，冻结了其它层，那么反向传播不会进入到这些层中，但是前向计算是会有的。如果想进一步加速finetune的速度，可以考虑先把所有数据执行一次前向操作，保存最后一层的中间的结果，然后以此中间结果为输入，训练整个网络。可以节省前向计算的一些时间。但如果finetune的epoch较少，那么感觉读写消耗的时间可能就已经很多了，不划算，加速效果也不明显。

猜你喜欢

转载自blog.csdn.net/chanbo8205/article/details/86231124

tensorflow冻结部分层，只训练某一层

tensorflow抽取某一层的特征

pytorch 尝试冻结一部分层,对其他层进行训练

[ Keras ] ——基本使用：(2) fine-tune+冻结层+抽取模型某一层输出

pytorch 提取网络中的某一层并冻结其参数

记录一下Tensorflow下实现DCNN的迁移学习（即冻结固定层，只训练某几层）

TensorFlow 训练多个loss函数技巧：训练步骤，冻结部分层（freeze some scopes），从tensorboard检查问题

使用Caffe和训练好的model从图像中提取某一层特征

Tensorflow添加一层神经层

TensorFlow只训练部分参数

pytorch 加载使用预训练模型和 fine tune 模型微调(冻结一部分层)实战

打印tensorflow每一层结构

tensorflow冻结层的方法

Keras 获取中间某一层输出

获取Pytorch中间某一层权重或者特征

求树的某一层的节点最多

【colab pytorch】提取模型中的某一层

keras的某一层输出之二

迁移学习-如何使用预训练权重，冻结部分层权重训练

tensorflow学习笔记十六：tensorflow官方文档学习如何训练Inception v3模型最后一层

tensorflow 固定部分参数训练，只训练部分参数

【Pytorch进阶】Pytorch冻结部分层的参数

torch - 冻结部分层网络参数

tensorflow Cpp获取网络每一层的名字

tensorflow 怎么只训练一部分变量

caffe网络中屏蔽某一层的输出Silence层

keras获得某一层或者某层权重的输出

Hive数据分层有哪些优点？具体每一层含义是什么？

pandas按某一层索引分组取某一列的最大值，groupby()，idxmax()

css忽略某一层的存在：pointer-events:none

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)