记录一下关于DQN的想法

下载了几份代码,就两份没有报错通过了

DQN玩FlappyBird

https://github.com/yenchenlin/DeepLearningFlappyBird

DQN玩Cartpole

https://www.cnblogs.com/caorui/p/6431156.html

思路主要是这样的,像玩小鸟的就是通过障碍物能继续走,reward 1和-100, action也是1和0,玩平衡车是能立住就reward是1,立的时间长评分高,并不是reward

平衡车位置:D:\virtualenv\venv\env37\gym\envs\classic_control\cartpole.py

猜你喜欢

转载自www.cnblogs.com/stenci/p/11468259.html