模型不收敛是因为什么

模型不收敛,首先是看training loss下降与否,如果training loss并不能稳定下降,则可能:

  • 数据集中signal和target是否按顺序匹配问题
  • 数据集是否进行了归一化或者标准化
  • 模型参数初始化问题
  • 你的计算图可能在训练前传入了与data无关的tensor

如果training loss下降,vallidation loss不稳定,则可能是:

  • validation 数据集不匹配问题
  • model.triain()和model.eval() with torch.no_grad()指定问题
  • 过拟合

解决方法:

  • 多换几个模型;换个数据;分别从数据问题,模型问题进行逐步排查。

猜你喜欢

转载自blog.csdn.net/qq_43369406/article/details/131295641
今日推荐