【人工智能概论】 PyTorch固定部分参数实现对指定层参数的训练与遇到的问题 - 代码天地

【人工智能概论】 PyTorch固定部分参数实现对指定层参数的训练与遇到的问题

企业开发 2023-10-01 03:51:29 阅读次数: 0

【人工智能概论】 PyTorch固定部分参数实现对指定层参数的训练与遇到的问题

文章目录

【人工智能概论】 PyTorch固定部分参数实现对指定层参数的训练与遇到的问题
一. 问题的描述
二. 代码实现
三. 遇到的问题——RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn

一. 问题的描述

对模型进行参数加载后，固定部分层的参数，对剩余层进行训练。

二. 代码实现

通过设置条件，实现将满足条件的参数设置为不更新，代码如下

for name, param in model.named_parameters(): # 遍历所有参数块
	if 'fc_offset' not in name: # 设置要求
		param.requires_grad = False  # 对符合要求的参数设置不更新
	# print(name, param.requires_grad)  # 显示所有模型模块，以及梯度情况

用filter过滤参数，防止优化器仍对所有参数进行更新

params = filter(lambda p: p.requires_grad, model.parameters())
optimizer = torch.optim.Adam(params, lr=learning_rate)

至此即可

三. 遇到的问题——RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn

该问题说明loss的梯度被关闭了，即loss的require_grad(False)。
这应该是因为如果将最后一层模型参数梯度关闭，则计算出来的loss也没有梯度，不能追踪，所以要将loss的梯度再手动设置为True。
如下例：

loss.requires_grad_(True)  
loss.backward()

猜你喜欢

转载自blog.csdn.net/qq_44928822/article/details/130759332

【人工智能概论】 PyTorch固定部分参数实现对指定层参数的训练与遇到的问题

【人工智能概论】 PyTorch可视化工具Tensorboard安装与简单使用

【人工智能概论】 PyTorch中的topk、expand_as、eq方法

【人工智能概论】用Python实现数据的归一化

【人工智能】PyTorch安装

人工智能的认识问题

【人工智能概论】代码运行耗时计算、使用GPU训练网络、元素是Tensor的List转化成Tensor、model.train()与model.eval()

pytorch固定部分参数进行网络指定层训练

人工智能 1.概论

《人工智能概论》总结报告

《人工智能概论》课程重点总结

利用人工智能实现智能安全预防：基于人工智能的智能安全监测

人工智能NLP项目_pytorch（2）

人工智能之部分习题

当人工智能遇到区块链（二）

人工智能训练师-云小蜜

云小蜜人工智能训练师

Ubuntu人工智能训练环境搭建

训练人工智能的中国县城工人

【人工智能】Chatgpt的训练原理

人工智能与伦理问题浅谈

问题规约---漫谈人工智能

目前人工智能存在的问题

人工智能--问题规约求解方法

关于人工智能的几个问题

人工智能 —— 状态空间问题表示

预测房价：人工智能回归问题

强人工智能基本问题

人工智能算法的实现（上）

人工智能算法的实现（下）

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)