强化学习使用gym时出现错误:ValueError: too many values to unpack (expected 4)

编程语言 2023-05-05 05:19:33 阅读次数: 0

目录

(1)env.step()的返回值问题

(2)ale-py包问题

1.问题描述

最近在学强化学习，用parl和gym实现Pong游戏的策略梯度-REINFORCE算法，主要的代码参考paddle的parl的教程lesson4课程（具体链接：PARL/examples/tutorials/parl2_dygraph at develop · PaddlePaddle/PARL · GitHub）

但在写代码的过程中遇到了一个问题，在其他代码没有任何问题的情况下，运行train.py

env.step()函数会出现：ValueError: too many values to unpack (expected 4)

2.问题分析

首先排除env.step(action)的传入参数没有问题，那问题只能出现在env.step(action)的执行和返回的过程中（在分析问题的过程中，我参考这个博主的帖子：pytorch报错ValueError: too many values to unpack (expected 4)_阮阮小李的博客-CSDN博客）

(1)env.step()的返回值问题

我通过gym的官网文档（Core - Gym Documentation），查看了env.step()的返回值定义。

扫描二维码关注公众号，回复： 14997932 查看本文章

并将train.py代码中的这句话

obs, reward, done,  _ = env.step(act)

修改为

obs, reward, done, _, _, _ = env.step(act)

结果是问题没有解决！

(2)ale-py包问题

因为在这之前，我之前学习的过程中也编写好了其他算法和gym游戏的代码，测试过多次是可以跑通的，在这个错误出现后，我第一时间运行了之前的代码，出现了一模一样的错误，我突然想起来因为在创建Pong游戏环境时，会提示Pong游戏被gym转移到ale-py，所以pip install ale-py安装了ale-py，所以问题就出现在ale-py这个功能包！

env = gym.make('Pong-v4')

3.问题解决

使用pip list命令检查gym和ale-py的版本，我的ale-py版本是0.8.0（pip中可安装的最新版本是0.8.0），而我的gym是0.22.0（此时pip可安装的最新版本是0.26.2），我意识到是ale-py版本太高的问题，最后把ale-py的版本重装为0.7.2，问题解决，并且提示我obs, reward, done, _, _, _ = env.step(act)这句话有问题，因为只需要4个输入参数，修改之后问题解决！

4.总结

总结来说就是ale-py的版本太高，不适配gym版本。

猜你喜欢

转载自blog.csdn.net/Er_Studying_Bai/article/details/127441552

强化学习使用gym时出现错误:ValueError: too many values to unpack (expected 4)

ValueError: too many values to unpack (expected 4)

too many values to unpack (expected 4)

ValueError: too many values to unpack (expected 4)解决办法

报错 ValueError: too many values to unpack (expected 2)

已解决ValueError: too many values to unpack (expected 2)

ValueError: too many values to unpack (expected 2)问题

ValueError: too many values to unpack (expected 9)解决方案

too many values to unpack (expected 2)

Pytorch : too many values to unpack (expected 2)

too many values to unpack

text.collocations() 出现 ValueError: too many values to unpack (expected 2)

ValueError: too many values to unpack (expected 2) python运行出现这个代码的原因

机器学习报错解决2——ValueError: too many values to unpack (expected 3)

关于出现too many values to unpack：

[已解决]requests.post(url,data)报ValueError:too many values to unpack (expected 2)

opencv 轮廓检测函数findcontours()出现错误ValueError: too many values to unpack (expected 2)的解决办法

rror: too many values to unpack

too many values to unpack的问题

pyspark出现异常 ValueError: too many values to unpack

关于 Python opencv 使用中的 ValueError: too many values to unpack

python 常见错误: too many values to unpack

解决cv2.findContours返回值too many values to unpack (expected 2)的问题

【python学习笔记】for循环遍历两个列表失败—— ValueError: too many values to unpack

python序列化存在问题：too many values to unpack

【YOLOv7热力图可视化】参考链接非常棒，此博客用于记录一些细节（如果遇到报错：ValueError: too many values to unpack (expected 2)）

ValueError: not enough values to unpack (expected 4, got 1) Python（笨办法学Python3）

Celery 在Windows下启动worker时出现错误：ValueError: not enough values to unpack (expected 3, got 0)

CELERY: ValueError('not enough values to unpack (expected 3, got 0)',)

ValueError: not enough values to unpack (expected 6, got 1)

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)