pytorch保存提取net的不同文件格式pkl和pth

业界资讯 2023-04-16 15:57:07 阅读次数: 0

我们在训练深度学习模型的过程中，最好对已经训练好的深度学习模型进行保存，或者方便的加载别人训练好的模型微调节省训练时间，实现高效率解决问题。

为什么需要模型文件

深度学习的模型参数超级多比如：Transformer模型、Bert模型等。
训练的数据集一般很大，比如：1000G以上等。
若本地电脑的算力或者实验室的服务器算力基本不够，训练模型花费时间多，一个模型短则训练几天不能停，甚至几个月，有可能发生内存不够等。这时若有类似的训练好的模型可以直接拿来用然后微调是非常好的。

torch.save()实现对网络结构和模型参数的保存.有两种保存方式

一是保存整个神经网络的的结构信息和模型参数信息，save的对象是整个网络模型；
二是只保存神经网络的训练模型参数，save的对象是net.state_dict()。

假设有一个训练好的模型名叫net1

torch.save(net1, ‘7-net.pth’) # 保存整个神经网络的结构和模型参数

torch.save(net1, ‘7-net.pkl’) # 同上

torch.save(net1.state_dict(), ‘7-net_params.pth’) # 只保存神经网络的模型参数

torch.save(net1.state_dict(), ‘7-net_params.pkl’) # 同上

如果使用torch.save方法来进行模型参数的保存，那保存文件的后缀其实没有任何影响，结果都是一样的，很多.pkl的文件也是用torch.save保存下来的，和.pth文件一模一样的

不过，如果应用场景不是在这里，这两种格式的文件还是有区别的，.pkl文件是python里面保存文件的一种格式，如果直接打开会显示一堆序列化的东西，其实就是以二进制形式存储的，如果去read这些文件，则需要用’rb’而不是’r’模式。
而.pth文件则有不同的应用，Python在遍历已知的库文件目录过程中，如果见到一个.pth 文件，就会将文件中所记录的路径加入到 sys.path 设置中，于是 .pth 文件指明的库也就可以被 Python 运行环境找到了。

但其实不管pkl文件还是pth文件，都是以二进制形式存储的，没有本质上的区别，你用pickle这个库去加载pkl文件或pth文件，效果都是一样的。

模型文件的后缀

.pt ：这个后缀在官方文档里使用较多。
.pth ：这个后缀一般大家觉得惯例使用这个。
.pkl：这个后缀是因为 Python 有一个序列化模块 pickle ，然后使用它保存模型时，通常会起一个以 .pkl为后缀名的文件。

猜你喜欢

转载自blog.csdn.net/weixin_45277161/article/details/128949571

pytorch保存提取net的不同文件格式pkl和pth

pytorch 保存网络模型时保存得到的 pkl 和 pth 文件的区别

pytorch 模型保存方式(.pt, .pth, .pkl)

pytorch加载.pth格式文件

python实现同一word中的表格分别提取并保存到不同文件下

mysql导入不同文件格式的数据

Python 数据保存文件(.txt .pkl .csv格式) (持续更新）

pytorch 加载(.pth)格式的模型

Pytorch：保存和提取模型

【Pytorch】.pth权重文件解析

python保存变量生成pkl文件

pytorch实现网络的保存和提取

pytorch中训练模型的保存和提取

VB.Net 保存和读取设置文件（XML格式）

深度模型的保存及ckpt和pth的文件保存有什么区别？

springboot-用logback将日志文件按等级保存到不同文件

如何批量提取不同文件夹下的图片并随机重命名

pytorch模型参数文件.pth存放位置

PyTorch tutorial ：保存提取

PyTorch模型的保存与提取

同文件不同ajax访问相同文件

详解Pytorch中的网络构造，模型save和load，.pth权重文件解析

C# Log4net根据日志等级输出到不同文件

记录用户输入的命令不同用户生成不同文件和时间区隔

pytorch的.pkl文件转为onnx文件，亲测可行

怎样把数据变成pickle格式pkl格式的文件

点云文件的格式转换：ply转pcd,pcd转pth,查看pth格式文件

JS不同文件间函数调用

不同文件夹图标设计

不同文件夹下如何链接

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)