paddle随机种子的问题

诚然,百度提供的paddle+aistudio是一个很好的深度学习平台,但是在使用中发现随机种子好像失效的问题。

在pyotrch中可以可以固定随机种子,在保持各种配置不变的情况下,无论训练多少次都能够保证训练过程是一致的,比如每轮的loss、精度等与前几次训练都是相同的。

下面是关于这个问题的一些连接:

https://aistudio.baidu.com/paddle/forum/topic/show/987738
https://aistudio.baidu.com/paddle/forum/topic/show/990814

实验一:CPU能对齐

paddle可以通过paddle.seed(seed)设置paddlepaddle随机种子,通过一些实验,如果使用cpu训练,则能够保证可复现性。

这至少说明我的代码是没有问题的,不存在输入不同等原因。

但是设备设为GPU,则无法对齐。

实验二:在非aistudio平台测试

这次使用一台3090进行测试,使用paddle.seed(seed)固定随机种子,发现能够对齐,屁!之前是epoch设置太小,稍微大一点还是无法对齐

终极解决方法

就目前来看,paddle仅在CPU上可以通过随机种子对齐的,在GPU上无法对齐。

根据分析,是GPU上的cuDNN造成卷积算子等不定性,所以可以设定确定的卷积算子

export FLAGS_cudnn_deterministic=True

因为不定性算子就是在找最有算子计算,一但确定了那么速度可能就会慢了,到底慢多少这个就不确定了

首先,在终端设置环境变量

aistudio@jupyter-368487-6009734:~$ export FLAGS_cudnn_deterministic=True

在python加入检测,防止环境变量掉了

在主文件开头加入下面的代码,意思是查询环境变量中是否有FLAGS_cudnn_deterministic这个,没有证明掉了则触发异常,此时再次在终端设置环境变量即可。

import os

assert os.environ.get('FLAGS_cudnn_deterministic'),print("请设置$:export FLAGS_cudnn_deterministic=True")
print("存在环境变量FLAGS_cudnn_deterministic=True")

猜你喜欢

转载自blog.csdn.net/qq_40243750/article/details/130277662
今日推荐