Pytorch-detach()用法

其他 2021-04-02 23:54:05 阅读次数: 0

目的：

神经网络的训练有时候可能希望保持一部分的网络参数不变，只对其中一部分的参数进行调整。或者训练部分分支网络，并不让其梯度对主网络的梯度造成影响.这时候我们就需要使用detach()函数来切断一些分支的反向传播.

1 tensor.detach()

返回一个新的tensor，从当前计算图中分离下来。但是仍指向原变量的存放位置，不同之处只是requirse_grad为false.得到的这个tensir永远不需要计算器梯度，不具有grad.

即使之后重新将它的requires_grad置为true,它也不会具有梯度grad.这样我们就会继续使用这个新的tensor进行计算，后面当我们进行反向传播时，到该调用detach()的tensor就会停止，不能再继续向前进行传播.

注意：

使用detach返回的tensor和原始的tensor共同一个内存，即一个修改另一个也会跟着改变。

比如正常的例子是：

import torch

a = torch.tensor([1, 2, 3.], requires_grad=True)
print(a)
print(a.grad)
out = a.sigmoid()

out.sum().backward()
print(a.grad)

输出

tensor([1., 2., 3.], requires_grad=True)
None
tensor([0.1966, 0.1050, 0.0452])

1.1 当使用detach()分离tensor但是没有更改这个tensor时，并不会影响backward():

import torch
 
a = torch.tensor([1, 2, 3.], requires_grad=True)
print(a.grad)
out = a.sigmoid()
print(out)
 
#添加detach(),c的requires_grad为False
c = out.detach()
print(c)
 
#这时候没有对c进行更改，所以并不会影响backward()
out.sum().backward()
print(a.grad)
 
'''返回：
None
tensor([0.7311, 0.8808, 0.9526], grad_fn=<SigmoidBackward>)
tensor([0.7311, 0.8808, 0.9526])
tensor([0.1966, 0.1050, 0.0452])
'''

参考

1.pytorch的两个函数 .detach() .detach_() 的作用和区别

猜你喜欢

转载自blog.csdn.net/qq_31244453/article/details/112473947

Pytorch-detach()用法

pytorch-detach

pytorch-Detach的作用

pytorch: Variable detach 与 detach_

Pytorch：Variable detach

pytorch .detach() .detach_() 和 .data

Pytorch torch.Tensor.detach()方法的用法及修改指定模块权重的方法

PyTorch中 detach() 、detach_()和 data 的区别

pytorch中data和detach()的区别

pytorch张量复制clone()和detach()

[pytorch] detach().clone().cpu().numpy() 操作解析

【多线程】join()和detach()的用法

pytorch .detach() .detach_() 和 .data用于切断反向传播

Pytorch入门学习（九）---detach()的作用（从GAN代码分析)

pytorch中required_grad和detach的澄清

PyTorch中 tensor.detach() 和 tensor.data 的区别

pytorch：对比clone、detach以及copy_等张量复制操作

pytorch中关于detach clone 梯度等一些理解

Pytorch之data、clone()、detach()、copy_()区别

pytorch中.data与.item()，.numpy()，.detach()，.cuda()，.cpu()的作用

pytorch中.numpy()、.item()、.cpu()、.detach()及.data的使用

深入浅出Pytorch函数——torch.Tensor.detach

pthread_join和pthread_detach的用法

pytorch的两个函数 tensor.detach()，tensor.detach_()，tensor.clone() 的作用和区别

pytorch系列 --4 pytorch 0.4改动后Variable和Tensor合并问题data和.detach

Pytorch: detach 和 retain_graph,和 GAN的原理解析

对于pytorch中的detach copy 讲解很好的一篇博文

Pytorch中in-place操作相关错误解析及detach()方法说明

pytorch中copy_()、detach()、data()和clone()操作区别小结

PyTorch中view的用法

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)