RuntimeError: cublas runtime error : resource allocation failed at THCGeneral.cpp:250

pytorch报错:
RuntimeError: cublas runtime error : resource allocation failed at THCGeneral.cpp:250 #10

排查方法:
如果模型本身没有GPU存储不够的问题,那么考虑使用torch.nn.Embedding()除了问题。

embedding_layer = th.nn.Embedding(num_embeddings=3, embedding_dim= self.embedding_dim)

那么输入给embedding_layer的id的取值范围都应该在[0,num_embeddings)内,上面的问题很有可能是范围不在这里面导致的。

因此,确保输入的id在[0,num_embeddings)范围内。

另外,在调试bug的时候,不用使用gpu调试! 调试使用CPU跑模型。

猜你喜欢

转载自blog.csdn.net/jmh1996/article/details/115312543