强化学习 CartPole实验的一些启发 有没有可能设计一个新的实验呢?(杆子可以向360度方向倾倒,可行吗?)

最近在看强化学习方面的东西,突然想到了这么一个事情,那就是经典的CartPole游戏我们改变一下,或者说升级一下,那么使用强化学习是否能得到不错的效果呢?

原始游戏如图:

 

 一点个人的想法:

=================================================

猜你喜欢

转载自www.cnblogs.com/devilmaycry812839668/p/10227245.html