深度强化学习(资源篇)

理论
深度强化学习从入门到大师:以刺猬索尼克游戏为例讲解PPO(第六部分)
深度强化学习从入门到大师:简单介绍A3C (第五部分)
深度强化学习从入门到大师:以 Cartpole 和 Doom 为例介绍策略梯度 (第四部分)
深度强化学习从入门到大师:进一步了解深度Q学习(第三部分 - 下)
深度强化学习从入门到大师:以Doom为例一文带你读懂深度Q学习(第三部分 - 上)
深度强化学习从入门到大师:通过Q学习进行强化学习(第二部分)
深度强化学习从入门到大师:简介篇(第一部分)
学习何时做分类决策,深度好奇提出强化学习模型Jumper
NIPS 2018 | Spotlight论文:凭借幻想的目标进行视觉强化学习
伯克利、OpenAI等提出基于模型的元策略优化强化学习
自学习 AI 智能体第二部分:深度 Q 学习
自学习 AI 智能体第一部分:马尔科夫决策过程
滴滴 KDD 2018 论文详解:基于强化学习技术的智能派单模型

项目
强化学习工具Horizon开源:Facebook曾用它优化在线视频和聊天软件
开源啦:连DeepMind也捉急的游戏,OpenAI给你攻破第一关的高分算法
如何保持运动小车上的旗杆屹立不倒?TensorFlow利用A3C算法训练智能体玩CartPole游戏

资讯
DeepMind推出深度学习与强化学习进阶课程(附视频)
MIT科学家Dimitri P. Bertsekas最新2019出版《强化学习与最优控制》(附书稿PDF&讲义)
伯克利CS294深度强化学习课程资料放出(PPT+录像)
BAIR讲述如何利用深度强化学习控制灵活手
你需要新的好奇心方法克服强化学习中的拓展症
EMNLP 2018 | 用强化学习做神经机器翻译:中山大学&MSRA填补多项空白
人人能上手:OpenAI发射初学者友好的强化学习教程 | 代码简约易懂
「多巴胺」来袭!谷歌推出新型强化学习框架Dopamine
超越DQN和A3C:深度强化学习领域近期新进展概览
Facebook开源首个适应大规模产品的强化学习平台Horizon,基于PyTorch 1.0
深度强化学习中的好奇心
MILA 2018夏季深度学习与强化学习课程资源大放送
《深度强化学习》手稿开放了!
DeepMind 开源TRFL,又一个强化学习复现、创新好帮手
OpenAI开课了!深度强化学习最全课程包,教程、代码、习题、文档一网打尽
让机器帮你做决策!强化学习在智能交互搜索的应用分享

猜你喜欢

转载自blog.csdn.net/weixin_44356285/article/details/86005061