pytorch怎么使用任一Variable生成另外一个叶节点Variable - 代码天地

pytorch怎么使用任一Variable生成另外一个叶节点Variable

其他 2018-07-03 12:20:11 阅读次数: 0

时间：2018/2/7

一般情况下，用一个完整的网络就可以了。但是像我现在要做一个network in network，大网络里要附加一个小网络，而且还想单独训练这个小网络。使用pytorch实现这个想法的时候问题就来了：pytorch只对Variable叶节点有显式的梯度计算，所以任何其他的操作clone等都不能计算梯度的。而又不想训练这个单独的小网络的时候，将梯度传递到主网络里面去，所以有以下两种方法。

方法一：

使用Variable.detach() detach的官网介绍

比如模拟了一个网络的代码如下：

import torch
import numpy as np
from torch.autograd import Variable
import torch.nn as nn

a = np.arange(24).reshape(1, 2, 3, 4).astype(np.float32)
b = Variable(torch.from_numpy(a.astype(np.float32)))
d = b.clone().cuda() + 1
b.requires_grad = True



x1 = nn.Conv2d(2, 2, 1).cuda()
x2 = nn.ReLU().cuda()
l = nn.MSELoss()

x = x1(b.cuda())
c = x.detach()
c.requires_grad = True
xc = x1(c)

ls = l(xc, d)
ls.backward()

print b.grad
print '*' * 10
print c.grad

方法二：

使用clone（）

这样得到的变量的确不是叶节点，但是小网络里面用到的权值和偏置项是叶节点，pytorch还是能够将接下来的计算用于求算权重的梯度.

哈哈，折腾了将近一小时，不如脑袋短路一秒钟。

However，使用detach可以将graph结构就此断路，不会继续前传，clone则是不行的。

猜你喜欢

转载自blog.csdn.net/daniaokuye/article/details/79282657

pytorch怎么使用任一Variable生成另外一个叶节点Variable

【记录一个问题】ndk下使用c++11的condition_variable问题较多

Pytorch Variable

使用另外一个namespace的成员

Elasticsearch 中的节点（比如共 20 个），其中的 10 个选了一个 master，另外 10 个选了另一个 master，怎么办？

erlang节点互相ping，一个能ping通，另外一个不行。

用一个自定义的数组初始化tensorflow variable

Numpy , Tensor , Variable 增删一个值为1的维度

单节点的es添加另外一个节点组成主从集群

pytorch生成一个数组

浅谈Pytorch中的Variable的使用方法

JAVA——22.一个对象怎么调用另外一个对象

怎么在idea的一个javaweb项目里导入另外一个项目

Gitlab怎么将一个分支代码合并到另外一个分支

java 获取任一个时区时间

Variable

tensorflow学习笔记（一）：variable与get_variable

【pytorch】variable 和 tensor

Pytorch：Variable detach

Pytorch之Variable

pytorch:argument 0 is not a Variable

PyTorch中Variable变量

Pytorch之认识Variable

pytorch之Variable对象

pytorch中的Variable

pytorch 2 variable 变量

pytorch 之 Variable

pytorch之 Variable

pytorch 中的variable函数

Pytorch基础——Variable（变量）

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)