入力データが正しい形式であることを確認してください。入力データのディメンションとタイプがモデルの要件と一致していることを確認してください。
モデルパラメータの設定が正しいか確認してください。モデルのパラメーター設定が入力データと一致していることを確認してください。
GPU メモリが十分であるかどうかを確認します。GPU メモリが不足している場合は、バッチ サイズを減らすか、より小さいモデルを使用してみてください。
cuDNN および GPU ドライバーを更新します。最新バージョンの cuDNN および GPU ドライバーを使用していることを確認してください。
上記のどの方法でも問題が解決しない場合は、CPU でコードを実行して、より詳細なエラー情報を取得してみてください。
問題の説明
解決
環境的には問題ないですよ
import torch
torch.backends.cuda.matmul.allow_tf32 = True
torch.backends.cudnn.benchmark = False
torch.backends.cudnn.deterministic = False
torch.backends.cudnn.allow_tf32 = True
data = torch.randn([1, 32, 800, 800], dtype=torch.half, device='cuda', requires_grad=True)
net = torch.nn.Conv2d(32, 16, kernel_size=[1, 1], padding=[0, 0], stride=[1, 1], dilation=[1, 1], groups=1)
net = net.cuda().half()
out = net(data)
out.backward(torch.randn_like(out))
torch.cuda.synchronize()
画像が大きすぎるため、ビデオ メモリが不足しています。
CPUで実行できる
労働者を減らす
まだ問題はあります。。。。
今はしません。今すぐやらなければならないことがあります。
解決しました
以下のコードをコメントアウトします