《Reinforcement Learning: An Introduction》 读书笔记 - 目录

版权声明:本文为博主原创文章,欢迎交流分享,未经博主允许不得转载。 https://blog.csdn.net/qjf42/article/details/79658043

这一系列笔记是基于Richard S. Sutton的《Reinforcement Learning: An Introduction》第二版
因为这本书在出版之前,作者就在官网上发布了几次草稿版,不同时间发布的版本之间的排版有所差异(尤其是2017年和2018年的之间)
本系列基于2018年的几个版本,所以如果文中部分内容所指明的地方和读者看到的不一致,敬请谅解~

第2章:多臂老虎机(Multi-armed Bandits)

第3章:有限马尔科夫决策过程(Finite Markov Decision Processes)

第4章:动态规划(Dynamic Programming)

第5章:蒙特卡洛方法(Monte Carlo Methods)

第6章:时序差分学习(TD-Learning)

猜你喜欢

转载自blog.csdn.net/qjf42/article/details/79658043