强化学习资料汇总和一些个人心得

        最近开始接触强化学习,买了一些参考书,也在网上看了很多大神写的文章。现在把自己在网络上看到的比较好的资料汇总一下,方便日后自己查阅,也希望能帮助到一些初学者。由于本人的英文不是太好,所以看的资料基本都是中文的,如果有一定基础的同学,还是建议多看国外大神的博客和论文。

       首推知乎专栏--强化学习知识大讲堂

       这个专栏里内容比较全面,把强化学习领域里两大分支--值函数法和策略梯度法都进行了比较详细的介绍,同时也举了一些基于python的编程实例,把这个专栏认真看完,基本就能掌握大部分强化学习的知识了。专栏作者还出了书《深入浅出强化学习》,书里的内容基本就是专栏里的文章,喜欢看书学习的同学可以买一本,也算是支持下作者,毕竟原创不易。

       其次推荐一个知乎专栏--莫烦

       这个专栏偏重于编程实践,原理讲得并不深入,没有复杂的数学推导,非常适合初学者快速理解不同的强化学习方法,但是个人感觉有些东西作者讲得并不是很清楚,需要查阅其它资料帮助理解。这里推荐访问作者的个人网站--莫烦python,网站里涵盖了专栏里的内容,作者也把源码都放在github里了,简直是良心作者。同时网站里还有其它机器学习的内容,真是要给作者十万个赞!

       再推荐一个知乎专栏--智能单元

       这个专栏有挺多关于强化学习研究领域比较前沿内容的介绍,同时里面关于DQN文章我觉得写得非常好,通俗易懂!

       把上面三个专栏认真看完就基本差不多了,想跟进前沿领域还是多看国外论文吧。


      以下是个人学习时碰到的一些问题以及查阅的资料:

关于同策略(on-policy)和异策略(off-policy)

      https://blog.csdn.net/mmc2015/article/details/58021482

      https://blog.csdn.net/u013615687/article/details/71055870

关于行动策略

     https://blog.csdn.net/hanlin_tan/article/details/62078935

     https://blog.csdn.net/wangweiran1/article/details/49855959

     https://www.cnblogs.com/blueyyc/p/5544752.html

关于重要性采样

    https://blog.csdn.net/baimafujinji/article/details/53869358 

    https://blog.csdn.net/u011332699/article/details/74298555

关于DQN

    https://blog.csdn.net/itplus/article/details/9361915

    https://blog.csdn.net/songrotek/article/details/50951537

    https://blog.csdn.net/qq_32231743/article/details/72809101

    https://blog.csdn.net/Charel_CHEN/article/details/77408050?ref=myread

    https://zhuanlan.zhihu.com/p/21421729 这篇文章重点推荐下,它帮助我理解了Q值神经网络到底是如何更新的。

   

猜你喜欢

转载自blog.csdn.net/hnshhshjq/article/details/80038370