torch代码解析--optimizer.zero_grad

其他 2019-05-01 10:11:39 阅读次数: 0

#将梯度初始化为零
optimizer.zero_grad()
# 前向传播求出预测的值
outputs = net(inputs)
# 求出loss
loss = criterion(outputs, labels)
# 反向传播求出梯度
loss.backward()
 # 更新所有参数
optimizer.step()

问题：为什么每个batch都要设置一次optimizer.zero_grad？

回答：根据pytorch中的backward()函数的计算，当网络参量进行反馈时，梯度是被积累的而不是被替换掉；但是在每一个batch时毫无疑问并不需要将两个batch的梯度混合起来累积，因此这里就需要每个batch设置一遍zero_grad 了。

问题：

猜你喜欢

转载自blog.csdn.net/lqz790192593/article/details/89071541

torch代码解析--optimizer.zero_grad

torch代码解析为什么要使用optimizer.zero_grad()

Pytorch 中model.zero_grad 和optimizer.zero_grad等效

理解optimizer.zero_grad(), loss.backward(), optimizer.step()的作用及原理

optimizer.zero_grad(), loss.backward(), optimizer.step()的理解及使用

Pytorch 为什么每一轮batch需要设置optimizer.zero_grad

Pytorch中的optimizer.zero_grad和loss和net.backward和optimizer.step的理解

model.train()、model.eval()、optimizer.zero_grad()、loss.backward()、optimizer.step作用及原理详解【Pytorch入门手册】

with torch.no_grad()

with torch.no_grad()解答

with torch.no_grad()和backward()

torch.autograd.grad()详解

Torch.no_grad()影响MSE损失

torch.autograd.grad()函数用法示例

torch.Tensor.retain_grad()的使用举例

自动梯度autograd中的with torch.no_grad()

【Pytorch进阶】with torch.no_grad()用法详解

model.eval()和with torch.no_grad()

有关于torch.autograd.grad

【大规模训练】Optimizer state sharding (ZeRO)

optimizer（代码分析）

机器学习9:关于pytorch中的zero_grad（）函数

Zero-Knowledge Argument for Polynomial Evaluation with Application to Blacklists 代码解析

【DeepSpeed 教程】四，DeepSpeed ZeRO++博客和代码解析

RISC Zero zk-STARK证明系统代码解析

RISC Zero各功能模块代码解析

torch.Tensor.requires_grad_(requires_grad=True)的使用说明

什么时候该用with torch.no_grad()？什么时候该用.requires_grad ==False?

pytorch-x,norm(),torch.autograd.grad函数

torch.tensor默认requires_grad=False

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)