强化学习中的游戏atari 和 mujoco

atari:离散动作空间(如‘上’,‘下’两个动作)
mujoco:连续动作空间(如赛车的速度,一个连续的值)

猜你喜欢

转载自blog.csdn.net/Xurui_Luo/article/details/106842557