pytorch冻结网络参数，requires_grad与optimizer顺序的关系 - 代码天地

pytorch冻结网络参数，requires_grad与optimizer顺序的关系

企业开发 2023-04-09 06:16:09 阅读次数: 0

问题说明：

pytorch迁移学习时，需要对某些层冻结参数，不参与方向传播，具体实现是将要冻结的参数的requires_grad属性置为false，然后在优化器初始化时将参数组进行筛选，只加入requires_grad为True的参数，代码示例如下：

cnn = CNN() #构建网络

for n,p in cnn.named_parameters():
    print(n,p.requires_grad)
    if n=="conv1.0.weight":
        p.requires_grad = False

optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad,cnn.parameters()), lr=learning_rate)

但是如果把requires_grad属性置为false这个操作放在optimizer之后，会不会有影响，这个指定层的参数会不会被冻结呢？代码示例如下：

cnn = CNN() #构建网络

optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad,cnn.parameters()), lr=learning_rate)

for n,p in cnn.named_parameters():
    print(n,p.requires_grad)
    if n=="conv1.0.weight":
        p.requires_grad = False

经过打印每次迭代后参数组中的参数值，可以得出结论：

1、把requires_grad属性置为false的操作放在optimizer初始化之后，也可以达到参数被冻结的效果（该指定要冻结的层的参数完全没变化）

2、区别在于，先进行requires_grad属性置为false的操作，再optimizer初始化，不会将该层的参数放进优化器中更新，而先进行optimizer初始化，再进行requires_grad属性置为false的操作，会将所有的参数放进优化器中，但不更新该指定层参数，只更新剩下的参数。对比看来，optimizer中的参数量会相比前者会更大一点。

猜你喜欢

转载自blog.csdn.net/sinat_33486980/article/details/117952661

pytorch冻结网络参数，requires_grad与optimizer顺序的关系

pytorch迁移学习中parameters requires_grad=False和optimizer优化参数的探讨

PyTorch冻结网络参数

小知识点系列(二十) 本文(2万字) | 解读预训练 | 微调 | 迁移 | 模型冻结与解冻 | 对比优化器optimizer与requires_grad冻结 | PyTorch断点训练 |

pytorch中的 requires_grad和volatile

2018.11.14——pytorch中的grad_fn，requires_grad

pytorch冻结网络模型参数(迁移学习)

Pytorch训练过程中改变模型参数 requires_grad 属性

pytorch学习笔记——requires_grad和volatile

pytorch笔记：06)requires_grad和volatile

Pytorch-创建requires_grad=True的tensor

PyTorch学习笔记(1)——requires_grad和autograd.no_grad

关于pytorch当中的model.eval()和requires_grad=False

【PyTorch 计算图】requires_grad=True的leaf variable及其设计逻辑

param.grad、requires_grad、grad_fn、grad/梯度为None？

torch.tensor默认requires_grad=False

torch.Tensor.requires_grad_(requires_grad=True)的使用说明

pytoch 设置了requires_grad=True，但是计算梯度(grad)为none

什么时候该用with torch.no_grad()？什么时候该用.requires_grad ==False?

torch.nn.parameter 生成可更新的 tensor （requires_grad = True）

Pytorch 中model.zero_grad 和optimizer.zero_grad等效

【pytorch】冻结、固定部分参数

【Pytorch进阶】Pytorch冻结部分层的参数

Pytorch中的optimizer.zero_grad和loss和net.backward和optimizer.step的理解

Pytorch 为什么每一轮batch需要设置optimizer.zero_grad

pytorch 提取网络中的某一层并冻结其参数

pytorch如何冻结某层参数的实现

pytorch bug: a leaf Variable that requires grad has been used in an in-place operation

pytorch 更新部分参数（冻结参数）注意事项

神经网络冻结层，固定参数

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)