torch.save(obj=self.state_dict())和 torch.save(obj=model)的区别

模型有两种存储方式:
第一种:

def save_model(self, path):
    torch.save(obj=self.state_dict(), f=path)

保存结果:
在这里插入图片描述

第二种:

    def save_model(model):
        torch.save(obj=model, f='M.pth')

保存结果:
在这里插入图片描述

obj=self.state_dict()和obj=model的区别在于使用不同方法保存的不同对象。

self.state_dict()返回一个字典,其中包含模型的所有可学习参数,即所有层的权重和偏差。该字典可以保存到磁盘,然后加载回模型以恢复其状态。该state_dict()方法通常用于在训练、测试或推理期间保存和加载模型参数。

modelExternalAttention是表示整个模型的类的一个实例。这个对象也可以保存到磁盘,然后加载回内存以恢复整个模型,包括它的架构和状态。然而,这种保存和加载模型的方法不太常见,它通常用于在训练期间对模型进行检查点检查,以便稍后可以从保存的状态恢复训练。

总之,self.state_dict()只保存模型的可学习参数,而model保存整个模型对象,包括它的体系结构和状态,这两种方法在不同的场景中都有用,具体取决于你想要实现的目标。

可参考:为什么有的.pth文件储存的是数字有些.pth储存的是网络结构?

猜你喜欢

转载自blog.csdn.net/qq_45104603/article/details/129974104