torch.save(obj=self.state_dict())和 torch.save(obj=model)的区别 - 代码天地

torch.save(obj=self.state_dict())和 torch.save(obj=model)的区别

企业开发 2023-04-08 13:49:59 阅读次数: 0

模型有两种存储方式：
第一种：

def save_model(self, path):
    torch.save(obj=self.state_dict(), f=path)

保存结果：
在这里插入图片描述

第二种：

    def save_model(model):
        torch.save(obj=model, f='M.pth')

保存结果：
在这里插入图片描述

obj=self.state_dict()和obj=model的区别在于使用不同方法保存的不同对象。

self.state_dict()返回一个字典，其中包含模型的所有可学习参数，即所有层的权重和偏差。该字典可以保存到磁盘，然后加载回模型以恢复其状态。该state_dict()方法通常用于在训练、测试或推理期间保存和加载模型参数。

modelExternalAttention是表示整个模型的类的一个实例。这个对象也可以保存到磁盘，然后加载回内存以恢复整个模型，包括它的架构和状态。然而，这种保存和加载模型的方法不太常见，它通常用于在训练期间对模型进行检查点检查，以便稍后可以从保存的状态恢复训练。

总之，self.state_dict()只保存模型的可学习参数，而model保存整个模型对象，包括它的体系结构和状态，这两种方法在不同的场景中都有用，具体取决于你想要实现的目标。

可参考：为什么有的.pth文件储存的是数字有些.pth储存的是网络结构？

猜你喜欢

转载自blog.csdn.net/qq_45104603/article/details/129974104

torch.save(obj=self.state_dict())和 torch.save(obj=model)的区别

state_dict以及torch.save

torch.save(model.state_dict(), ‘best_model.pth‘)

pytorch框架网络参数保存和重载torch.save,torch.load,Unet

PyTorch保存网络结构以及参数【 torch.save()、torch.load() 】

深度学习——09模型的保存:torch.save()、加载:torch.load()

pytorch利用torch.save()保存模型及相关参数，以及读取保存之后的文件

pytorch保存模型等相关参数，利用torch.save()，以及读取保存之后的文件

EarlyStopping，torch.save保存模型文件到指定文件夹下并动态命名

torch.save torch.load 四种使用方式如何加载模型如何加载模型参数如何保存模型如何保存模型参数

[nlp] torch.load 和 torch.load_state_dict 有什么区别

Keras中model.save()和model.save_weights()的区别

torch.nn.Module.load_state_dict:

obj[‘x‘]和obj[x]的区别

qt 5.15.2 QObject *obj、QObject &obj和QObject obj的区别

--save-dev 和 --save的区别

npm --save-dev 和--save区别

npm --save和--save-dev区别

--save 和 --save-dev 之间的区别

npm 的 --save 和 --save-dev 的区别

npm --save-dev 和 --save 的区别

npm的--save和--save-Dev的区别

let obj1=obj;和let obj1={...obj}的区别

tensorflow model save and restore

save_model ManyToManyField

TensorFlow - save model

pytorch中model.train()，model.eval() 和 torch.no_grad()的区别

model.eval()跟torch.no_grad()的区别

-save-dev 与 -save的区别

--save与--save-dev的区别

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)