pytorch中required_grad和detach的澄清 - 代码天地

pytorch中required_grad和detach的澄清

其他 2018-11-05 22:28:04 阅读次数: 0

版权声明：转载注明出处 https://blog.csdn.net/york1996/article/details/83382325

最近和别人讨论，发现了自己以前的认识错误的地方。

代码中的detach和required_grad的引入是减少了计算量，required_grad=false会计算误差，不计算wb的梯度（原因在于一个网路如果是ABC层这样的连接方式，B不求梯度，但是A还是会获得梯度，这就需要计算B的误差，从而传播到A，而计算B中参数的梯度就没有必要了），而detach会切断反向传播，不计算误差也不计算梯度。之所以之前会认为加不加required_grad=false和detach不影响效果，是因为只看到了输出结果的不变，没有意识到计算时间和空间需求的变化，而这两点的确是不那么容易监测出来的。另一方面是对反向传播算法的不熟练。以后下结论不能那么武断了，做实验也要学会控制变量和观察实验结果。的确写代码应该追求简洁，不写冗余的代码。这就需要分清冗余与否。

以上认识也可能和

这就印证了认识真理的反复性、前进性和上升性。

猜你喜欢

转载自blog.csdn.net/york1996/article/details/83382325

pytorch中required_grad和detach的澄清

PyTorch中 detach() 、detach_()和 data 的区别

pytorch中data和detach()的区别

pytorch中的 requires_grad和volatile

pytorch .detach() .detach_() 和 .data

Pytorch 中model.zero_grad 和optimizer.zero_grad等效

PyTorch中 tensor.detach() 和 tensor.data 的区别

2018.11.14——pytorch中的grad_fn，requires_grad

pytorch张量复制clone()和detach()

pytorch中copy_()、detach()、data()和clone()操作区别小结

pytorch迁移学习中parameters requires_grad=False和optimizer优化参数的探讨

pytorch中model.train()，model.eval() 和 torch.no_grad()的区别

pytorch: Variable detach 与 detach_

Pytorch中的optimizer.zero_grad和loss和net.backward和optimizer.step的理解

pytorch .detach() .detach_() 和 .data用于切断反向传播

PyTorch学习笔记(1)——requires_grad和autograd.no_grad

pytorch中关于detach clone 梯度等一些理解

pytorch中.numpy()、.item()、.cpu()、.detach()及.data的使用

pytorch中.data与.item()，.numpy()，.detach()，.cuda()，.cpu()的作用

机器学习9:关于pytorch中的zero_grad（）函数

PyTorch中关于backward、grad、autograd的计算原理的深度剖析

PyTorch 中的“with torch no_grad”有什么作用？

pytorch学习笔记——requires_grad和volatile

pytorch笔记：06)requires_grad和volatile

pytorch 的自动求导机制-----requiers_grad 和volatile

Pytorch：Variable detach

pytorch-detach

Pytorch-detach()用法

pytorch-Detach的作用

jq中detach（）和remove（）的区别

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)