pytorch打印模型梯度

其他 2023-04-08 08:31:24 阅读次数: 0

简介

有时候在调试模型训练过程时，我们需要打印模型中参数的梯度，去查看是否存在梯度消失或者梯度爆炸的问题。可以通过在backward之后查看params的grad属性来确认。

参考代码如下所示。

import torch

# 定义模型
class MyModel(torch.nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.fc1 = torch.nn.Linear(10, 5)
        self.fc2 = torch.nn.Linear(5, 2)

    def forward(self, x):
        x = self.fc1(x)
        x = torch.relu(x)
        x = self.fc2(x)
        x = torch.softmax(x, dim=1)
        return x

# 创建模型实例
model = MyModel()

# 定义输入和目标向量
x = torch.randn(2, 10)
y = torch.tensor([[0, 1], [1, 0]], dtype=torch.float32)

# 进行前向传递
out = model(x)

# 计算损失
loss = torch.nn.functional.binary_cross_entropy(out, y)

# 根据损失计算梯度
loss.backward()

# 收集每个可学习参数的梯度
grads = {}
for name, param in model.named_parameters():
    if param.requires_grad and param.grad is not None:
        grads[name] = param.grad

# 输出梯度
print(grads)

猜你喜欢

转载自blog.csdn.net/u012526003/article/details/129793339

pytorch打印模型梯度

pytorch打印模型信息——torchinfo

pytorch打印模型参数，冻结训练等操作

【pytorch】torchsummary打印模型结构和参数信息

打印模型概率

PyTorch 打印模型结构、输出维度和参数信息（torchsummary）

Pytorch - 使用torchsummary/torchsummaryX/torchinfo库打印模型结构、输出维度和参数信息

3D打印模型网址

pytorch 打印模型层的名字的多个方式，以及对应显示，删除最后多个层的两种方式

关于blender怎么分割打印模型，拆件！

3D打印技术之3D打印模型结构分析

打印模板-Zebra指令

3d打印模型为什么文件格式必须是stl和stp的？

神经网络打印模型参数及参数名字和数量

文本控制3D打印模型，麻省理工最新产品并公布论文

pytorch计算模型关于输入数据的梯度

【pytorch】pytorch读模型打印参数

广理院“创想杯”3D打印模型设计大赛圆满落幕

CPCL简易打印模板设计

ABAP 打印模板上传公司LOGO

EasyBPM打印模板的缓存问题

kernel打印模块驱动加载时间

HTML定义ESCPOS热敏打打印模板,打印小票

单据打印模板设计及打印实现最佳实践

E店宝打印模板，产品明细打印代码。

Javascript结合C-Lodop实现票务打印模板

打印模板显示扩展字段名称

PyTorch学习笔记(4)——自定义Loss Function（自动打印每次的梯度）

pytorch查看模型的梯度和权重和保存模型及其参数

【PyTorch】PyTorch中的梯度累加

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)