DQN的论文发展:
https://www.jianshu.com/p/b92dac7a4225
DQN的开篇之作:Playing Atari with Deep Reinforcement Learning
- 阐述了reinformation learning和deep learning的不同
- 介绍了传统的RL和Q-learning,给出了基本概念和公式
- 使用CNN进行RL的优点
- 给出了使用NN做RL的目标函数
(下面的原文给出了基本的概念,并从传统的RL引入到使用CNN的RL。从Q(s,a)这种离散的学习方法引入到Q(s,a,theta)这种通过学习参数来获取目标值的连续拟合方法)
- 论文提出了experiment replay概念,在网络学习时不时的使用以前经历过的状态,来让学习更佳牢靠 smooth
- 论文给出了DQN的算法描述,并给出了DQN的优点
- 最后论文给出了使用DQN完成游戏的网络学习设置,给出了实验和测评