分享《深入浅出强化学习原理入门》PDF+源代码+作者: 郭宪 / 方勇纯

下载:https://pan.baidu.com/s/1RQvGYYbIkc3ob3jB6AAu0Q

更多分享:https://pan.baidu.com/s/1g4hv05UZ_w92uh9NNNkCaA

 

《深入浅出强化学习原理入门》PDF及源代码

高清PDF,284页,带书签目录,彩色配图,文字可以复制;配套源代码。


《深入浅出强化学习原理入门》作者: 郭宪 / 方勇纯

用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。除了系统地介绍基本理论,还介绍了相应的数学基础和编程实例。既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。

高清PDF如图:

猜你喜欢

转载自www.cnblogs.com/wangmeng980/p/10165803.html