PyTorch里面的torch.nn.Parameter() - 代码天地

PyTorch里面的torch.nn.Parameter()

其他 2019-07-14 18:28:14 阅读次数: 0

在刷官方Tutorial的时候发现了一个用法self.v = torch.nn.Parameter(torch.FloatTensor(hidden_size)),看了官方教程里面的解释也是云里雾里，于是在栈溢网看到了一篇解释，并做了几个实验才算完全理解了这个函数。首先可以把这个函数理解为类型转换函数，将一个不可训练的类型Tensor转换成可以训练的类型parameter并将这个parameter绑定到这个module里面(net.parameter()中就有这个绑定的parameter，所以在参数优化的时候可以进行优化的)，所以经过类型转换这个self.v变成了模型的一部分，成为了模型中根据训练可以改动的参数了。使用这个函数的目的也是想让某些变量在学习的过程中不断的修改其值以达到最优化。

出现这个函数的地方

在 concat注意力机制中，权值 V是不断学习的所以要是 parameter类型，不直接使用一个 torch.nn.Linear()可能是因为学习的效果不好。
通过做下面的实验发现， linear里面的 weight和 bias就是 parameter类型，且不能够使用 tensor类型替换，还有 linear里面的 weight甚至可能通过指定一个不同于初始化时候的形状进行模型的更改。

做的实验

self.v被绑定到模型中了，所以可以在训练的时候优化

作者：VanJordan
链接：https://www.jianshu.com/p/d8b77cc02410
来源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

猜你喜欢

转载自www.cnblogs.com/jfdwd/p/11185050.html

PyTorch里面的torch.nn.Parameter()

PyTorch里面的torch.nn.Parameter()详解

Pytorch：torch.nn.Parameter理解

pytorch 中 torch.nn.Parameter()

torch.nn.Parameter理解

pytorch中的参数类——torch.nn.parameter

torch.nn.Parameter()，nn.Embedding()

torch.tensor和torch.nn.Parameter

torch.nn.Parameter()函数的讲解和使用

【torch.nn.Parameter 】参数相关的介绍和使用

AttributeError:module ‘torch.nn.parameter‘ has no attribute ‘UninitializedParameter‘

TypeError: cannot assign ‘torch.cuda.FloatTensor‘ as parameter ‘bias‘ (torch.nn.Parameter or None ex

torch.nn.parameter 生成可更新的 tensor （requires_grad = True）

pytorch torch.nn

pytorch里面的nn.AdaptiveAvgPool2d

pytorch的torch.nn.CrossEntropyLoss()

Pytorch_torch.nn.MSELoss

Pytorch----torch.nn.functional

Pytorch----torch.nn.init

Pytorch:torch.nn.Unfold

pytorch api torch.nn.Linear

pytorch api torch.nn.Module

pytorch api torch.nn.MSELoss

【Pytorch】torch.nn.functional.normalize

【pytorch】torch.nn.Module 模块笔记

pytorch-torch.nn-激活函数

pytorch-torch.nn-池化层

pytorch之torch.nn.Sequential

pytorch-torch.nn-卷积层

Pytorch教程[04]torch.nn---Containers

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)