RuntimeError: CUDA error: CUBLAS_STATUS_NOT_INITIALIZED when calling `cublas‘

其实对于这种cuda error,由于torch本身是把tensor送进去黑盒,里面发生什么事情是看不见的。

原因有多种多样,
标签出界
cuda 内存不足
shape不符合
。。。

但是在cpu的话,错误的定位就范围相对更小。所以在trouble shooting的时候可以尝试先cpu跑到这个地方让他报错,再进行cuda的跑,(如果效率上说得过去)可以有效发现问题所在。

另:我自己本次error出现的情况是,公用GPU上另一个人占了99%的内存,我的内存一开始够但到了那个模块就不够了,出现了这个错误,没出现out of memory错误。

我切换了cpu后,错误提示就比GPU清晰多了。

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/Yonggie/article/details/130931694