stablebaseline3中如何连续训练，并且保存模型 - Code World

stablebaseline3中如何连续训练，并且保存模型

Enterprise 2023-06-24 23:08:25 views: null

stablebaseline3中如何连续训练，并且保存模型

stablebaseline3是rl 领域很经典的一个学习框架
其方便简单实用
不过如果想要学习并且熟练应用，了解其中的参数设置是非常重要的。
比如，官方给出的文档只是最简单的使用方法：


env = make_vec_env("MountainCarContinuous-v0", n_envs=4)

model = PPO("MlpPolicy", env, verbose=1, tensorboard_log="./50w/mountain_con_ppo_monitor/")
model.learn(total_timesteps=500000)
model.save("./50w/save/ppo_mountain_car_expert")

这是最简单的一种，使用ppo+mlppolicy进行训练的设置方法，程序在达到50w的timestep之后便会进行模型保存并且储存模型到制定的logidir文件夹

但是如果我们想要在多个timestep都保存模型，那么就应该如下方式：

for i in range(10):
    model.learn(total_timesteps=20000, reset_num_timesteps=False, tb_log_name="PPO")
    model.save(f"{models_dir}/{TIMESTEPS * i}")

这样，使用 reset_num_timesteps这个参数之后，每次训练完不会释放模型参数，并且会继续连续下一个iteration的训练，因此可以达到多次保存结果的目的
在这里插入图片描述
respect！

Guess you like

Origin blog.csdn.net/qq_41725313/article/details/128751270

stablebaseline3中如何连续训练，并且保存模型

如何训练ChatGPT模型

PyTorch 保存和加载模型参数，从预训练模型中加载部分参数，包括预训练模型中某些参数不匹配的情况

pytorch多GPU训练模型保存及加载

THREE.JS中如何保存和加载场景中的网格模型，以BoxGeometry几何体为例。

TF模型训练中数据shuffle对模型性能的影响

python_torch_加载数据集_构建模型_构建训练循环_保存和调用训练好的模型

JavaScript中的事件模型如何理解

TensorFlow Estimator 中的模型保存为Checkpoints格式

如何轻松训练大模型？来NVIDIA GTC，听OneFlow的解决方案

课程五学习笔记：如何训练ViT模型？DeiT算法解析

31、类和对象在内存中是如何保存的？

Ubuntu16.04中caffe-ssd(GPU版)训练自己的数据并测试模型

自然语言处理中的预训练模型 —— 邱锡鹏老师的演讲记录

分割学习训练技巧模型

Pytorch学习系列之十：如何确定合适的epoch数、在加载的模型基础上继续训练

Unity 工具之日志保存本地，并且邮件附件发送到邮箱（线程中写入和邮件（Gmail）发送，不占用主线程）

【模型训练】目标检测实现分享三：详解 YOLOv3 算法实现

试题算法训练连续正整数的和 java 题解 118

如何实现 table 中单元格有最大宽度并且可以换行，外面加带一个大小固定的带滚动条的div

如何把视频号中的视频下载下来,可轻松保存到相册

GAN 网络如何训练。generator？

BERT 模型预训练流程简单认识

pytorch实现逻辑回归模型训练

NLP预训练模型学习总结

openvino量化自己训练的yolov3模型至int8(有成功验证截图)

如何训练你的ResNet：网络架构对训练时间的影响

如何查看xshell保存的密码

从rookie到基佬~005：模型保存

TensorFlow2.0 —— 模型保存与加载

Recommended

Ranking

#2019110700005

What materials and procedures are required for patent transfer

What is the blockchain Ethereum triplet state root transaction root receipt root

Front-end study notes 04 --- About the insertion of html pictures and videos

Documents required for the filing of WeChat Mini Programs in special industries, the filing process of WeChat Mini Programs in special industries, how to file WeChat Mini Programs in special industries

2017 Qingdao-site tournament I The Squared Mosquito Coil

[BZOJ3165][HEOI2013]Segment (line segment tree without marking)

Kettle series: KettleEasyExpand, an open source Kettle universal plugin by Ma Jinju

The latest tutorial on making framework for iOS

DAX Section 6: Statistical Functions

Daily

More

2024-05-14(9)

2024-05-13(8)

2024-05-12(28)

2024-05-11(32)

2024-05-10(34)

2024-05-09(32)

2024-05-08(18)

2024-05-07(34)

2024-05-06(6)

2024-05-05(0)