Q-learning算法汇总

https://blog.csdn.net/itplus/article/details/9361915经典的六个房间解释算法
http://blog.sina.com.cn/s/blog_151a90a3b0102xg0p.html上面的可复制版本
https://www.jianshu.com/p/29db50000e3f 上面算法的python实现
https://blog.csdn.net/weixin_32759777/article/details/104163272?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1上面算法的另一个python实现
https://blog.csdn.net/count_on_me/article/details/82952391?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task上面算法的matlab实现(没试过不知道是否可行)
https://morvanzhou.github.io/tutorials/machine-learning/reinforcement-learning/2-1-A-q-learning/莫凡简单带你了解一下
https://blog.csdn.net/qq_36124802/article/details/79882269莫凡的小案例的代码详细注释版本
https://blog.csdn.net/Fitz_p/article/details/82975129?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task今天给大家分享如何用Q_learning算法来实现走迷宫,我们的红色方块会一次次的尝试不同的格子,直到落入黑格子,获得惩罚1;或者走进黄格子,获得奖励1为止。每一次游戏都会更新Q_table的权重,以实现红色方块下一次能够更加快速的找到黄格子。代码注释版本

发布了1 篇原创文章 · 获赞 0 · 访问量 6

猜你喜欢

转载自blog.csdn.net/lilisad/article/details/105355548