Pytorch因nn.Parameter导致实验不可复现的一种情况 - 代码天地

Pytorch因nn.Parameter导致实验不可复现的一种情况

企业开发 2023-12-18 01:15:39 阅读次数: 0

文章首发见博客：https://mwhls.top/4871.html。
无图/格式错误/后续更新请见首发页。
更多更新请到mwhls.top查看
欢迎留言提问或批评建议，私信不回。

没解决，只是记录这种情况。

也可以多次实验取均值以避免结果复现。

场景

自己的模块中，包含一个与x相加的可学习参数，导致单卡同种子下结果无法复现。
- 去掉该模块，能正常复现。
- 保留声明，注释使用后，能正常复现。且结果与无该模块的结果一致。
除了在训练前设定种子外，我还在模块内部再次设置了种子，但依然无效。

相关代码

    def __init__(self):
        self.pos = torch.nn.Parameter(torch.zeros((1, 1, config.DATA.HEIGHT, config.DATA.WIDTH)))
    
    def set_seed(self):
        seed = 1
        random.seed(seed)
        np.random.seed(seed)
        torch.manual_seed(seed)
        torch.cuda.manual_seed(seed)
        torch.backends.cudnn.deterministic = True
        torch.backends.cudnn.benchmark = False
    
    def forward(self, x):
        x += self.pos
        return x

吐槽

在第一次增加后，性能增了1个点，我还以为我nb起来了。
- 后来习惯性复现的时候，发现结果又变了。
- 调试几天才发现是这个原因。
考虑的性能变好，大不了我多次实验取均值。
- 结果多次实验都掉了，再也回不去了。
- 所以也没继续解决。
值得一提的是，TransReID的代码中，就是这么用的，但是它的结果就能复现，咱们明明都设置种子了。下面是TransReID里用的。

    self.pos_embed = nn.Parameter(torch.zeros(1, num_patches + 1, embed_dim))

猜你喜欢

转载自blog.csdn.net/asd123pwj/article/details/133678501

Pytorch因nn.Parameter导致实验不可复现的一种情况

nn.Parameter()

pytorch 中 drop_last与 nn.Parameter

【笔记】Pytorch nn.Parameter()：作为nn.Module中的可训练参数使用

nn.Parameter和tensor 的异同是：

scala中的"unbound placeholder parameter"中的一种情况

PyTorch学习——关于tensor、Variable、nn.Parameter（）、叶子节点、非叶子节点、detach()函数、查看网络层参数

导致oracle 本地分区索引失效的一种情况

一种使用emwin库函数导致hardfault的情况

一种使用 sprintf 导致死机的情况

ORA-01017的一种情况：sysdba可以登录，normal不可登录

Android5.0L下因sensorservice crash导致systemserver重启的另外一种场景分析

一种导致js全局变量访问不到的情况

一种导致 emwin 中 EDIT 控件不显示的情况

Bug记录——nn.Parameter（）参数不更新、根据loss自学习权重变量不更新、pytorch 模型自定义参数不更新、网络梯度为None，参数不更新解、tensor参数有梯度，但不更新

PyTorch里面的torch.nn.Parameter()

Pytorch：torch.nn.Parameter理解

pytorch 中 torch.nn.Parameter()

ftp命令在cmd中可用，在批处理bat文件中就不可用的一种情况

Maven抛bug的一种情况

ftp打不开的一种情况

ubuntu内核冲突的一种情况

fixed 不生效的一种情况

发生多态的一种情况

Excel公式无效的一种情况

[pytorch] 一种加速dataloder的方法

unity openxr导致导致程序崩溃的一种可能

超卖问题复现及一种解决方法

pytorch中的参数类——torch.nn.parameter

PyTorch里面的torch.nn.Parameter()详解

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)