强化学习 baselines项目源码部分解读

最近发现强化学习挺有意思,但是发现这样的博客挺少的,就随手记录下学习的过程!
baselines github地址
下载慢的同学用百度云:链接:https://pan.baidu.com/s/1shRa5hl6kqffESmnpF72uA
提取码:kkw3

DeepMind团队整合了gym环境方便后人能更方便的学习,之后又把目前的强化学习算法做成了一个baselines项目,项目中包含了到目前为止各种强化学习算法,包括Q-learning,DQN,和DQN的各种改进,A2C,DDPG,PPO等。用户使用只需要像使用sklearn库里的机器学习算法那样简单,调用一下函数,修改一下超参数就能坐享其成了。感谢DeepMind。
在这里插入图片描述苦于现在只能mac和linux系统装,我Windows的就很尴尬了。我花了些时间来阅读它的DQN以及相关的源代码。以下分开来列出:

Google的DeepMind团队专门致力于研究人工智能,当然在强化学习领域也是世界领先水平,在2015年,DeepMind团队在nature杂志上发表了一片名为《Human-level control through deep reinforcement learning》的论文,成功将强化学习和深度学习结合起来-------命名为深度强化学习(DQN),可以说是具有划时代意义的文章,同年深度强化学习DeepMind团队的研发下,产出了Alpha Go,攻破了象征着人类智力顶峰的围棋!有人说,如果一千年后,回首你所经历过最有意义的历史事件,那一定是2016年人工智能alpha go战胜围棋世界冠军李世石的那场比赛。

发布了11 篇原创文章 · 获赞 14 · 访问量 1006

猜你喜欢

转载自blog.csdn.net/qq_41832757/article/details/104388961