强化学习资料汇总和一些个人心得

最近开始接触强化学习，买了一些参考书，也在网上看了很多大神写的文章。现在把自己在网络上看到的比较好的资料汇总一下，方便日后自己查阅，也希望能帮助到一些初学者。由于本人的英文不是太好，所以看的资料基本都是中文的，如果有一定基础的同学，还是建议多看国外大神的博客和论文。

首推知乎专栏--强化学习知识大讲堂

这个专栏里内容比较全面，把强化学习领域里两大分支--值函数法和策略梯度法都进行了比较详细的介绍，同时也举了一些基于python的编程实例，把这个专栏认真看完，基本就能掌握大部分强化学习的知识了。专栏作者还出了书《深入浅出强化学习》，书里的内容基本就是专栏里的文章，喜欢看书学习的同学可以买一本，也算是支持下作者，毕竟原创不易。

其次推荐一个知乎专栏--莫烦

这个专栏偏重于编程实践，原理讲得并不深入，没有复杂的数学推导，非常适合初学者快速理解不同的强化学习方法，但是个人感觉有些东西作者讲得并不是很清楚，需要查阅其它资料帮助理解。这里推荐访问作者的个人网站--莫烦python，网站里涵盖了专栏里的内容，作者也把源码都放在github里了，简直是良心作者。同时网站里还有其它机器学习的内容，真是要给作者十万个赞！

再推荐一个知乎专栏--智能单元

这个专栏有挺多关于强化学习研究领域比较前沿内容的介绍，同时里面关于DQN文章我觉得写得非常好，通俗易懂！

把上面三个专栏认真看完就基本差不多了，想跟进前沿领域还是多看国外论文吧。

以下是个人学习时碰到的一些问题以及查阅的资料：

关于同策略（on-policy）和异策略（off-policy）

https://blog.csdn.net/mmc2015/article/details/58021482

https://blog.csdn.net/u013615687/article/details/71055870

关于行动策略

https://blog.csdn.net/hanlin_tan/article/details/62078935

https://blog.csdn.net/wangweiran1/article/details/49855959

https://www.cnblogs.com/blueyyc/p/5544752.html

关于重要性采样