Paddle：加载预训练权重以及固定部分权重微调 - 代码天地

Paddle：加载预训练权重以及固定部分权重微调

企业开发 2023-10-01 00:57:29 阅读次数: 0

1：加载预训练权重

通过load 和 set_state_dict 函数接口调用实现

# save
paddle.save(net.state_dict(), "old_net.pdparams")
paddle.save(opt.state_dict(), "old_opt.pdopt")

# load
state_dict_net = paddle.load("old_net.pdparams")
state_dict_opt = paddle.load("old_opt.pdopt")

# match
new_net.set_state_dict(state_dict_net)
new_opt.set_state_dict(state_dict_opt)

注意：

1：如果网络结构不完全一致：Paddle会自动跳过不一致的layer

2：固定权重进行微调

通过设置stop_gradient=True进行实现，比pytorch便捷一些

举例1：

对于固定网络层：如： stage1→ stage2 → stage3 ，设置 stage2 的输出，假设为y，设置 y.stop_gradient=True，那么， stage1→ stage2 整体都固定了，不再更新。

举例2：

扫描二维码关注公众号，回复： 16927097 查看本文章

cls0-cls9是网络的10个输出分支，只微调第7个分支权重

3：验证权重固定是否生效

通过named_parameters来查看，与pytorch基本类似

举例1：

for item in net.named_parameters():
    if item[0] == 'cls0.0.bias':
        print("####", item[0], item[1][0])
    if item[0] == 'cls6.0.bias':
        print("!!!!", item[0], item[1][0])

参考：

1：参数调整常见问题-使用文档-PaddlePaddle深度学习平台

猜你喜欢

转载自blog.csdn.net/lilai619/article/details/128671590

Paddle：加载预训练权重以及固定部分权重微调

pytorch权重加载以及冻结部分权重设置

TensorFlow只加载部分权重

加载MobileNetV2部分权重

载入模型部分权重的方法

【笔记】tf 模型继续训练 fineturn ：fineturn是已用于其它目标，预训练好模型的权重或者部分权重，作为初始值开始训练；可以加快收敛，提升速度

迁移学习-如何使用预训练权重，冻结部分层权重训练

【tensorflow】fine-tuning, 选择性加载ckpt部分权重

【keras】加载VGG16模型的预训练权重

Tensorflow 预训练权重有选择加载参数

ResNet、MobileNet预训练权重

[PyTorch]预训练权重的转换

研究total loss与val loss以及预训练权重

【用Python学习Caffe】6. 权重预设、预训练及微调

迁移学习、载入预训练权重和冻结权重

pytorch：预训练权重、冻结训练和断点恢复

resnet预训练模型以及微调

Pytorch存储权重以及如何加载

Keras预训练网络权重.h5存放位置

mmdetection 修改预训练模型权重类别数

关于Detectron库预训练模型的权重转换

pytorch加载已经保存的模型文件，并将其作为另一个网络的预训练权重

pytorch---之固定某些层权重再训练

pytorch模型权重与模型微调

权重

部分网络网络权重加载另一网络权重

pytorch 加载使用预训练模型和 fine tune 模型微调(冻结一部分层)实战

训练权重为nan

预训练与微调的区别

【待看】YOLO（darknet 框架）权重文件的种类和结构：后缀“.weight”和“.backup”文件；预训练权重模型文件

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)