输出,loss出现-inf 或者nan

原因有很多种,比如输入数据不对,或者模型有问题;
一般考虑梯度爆炸或者Loss爆炸,可以用debug模式检查问题的原因,观察什么时候出现的问题;
我产生的原因是在训练模型时,使用了model.eval(),将其改为model.train()后解决。

猜你喜欢

转载自blog.csdn.net/m0_46429066/article/details/105880368