DQN笔记

DQN的论文发展:

https://www.jianshu.com/p/b92dac7a4225

DQN的开篇之作:Playing Atari with Deep Reinforcement Learning

  1. 阐述了reinformation learning和deep learning的不同
  2. 介绍了传统的RL和Q-learning,给出了基本概念和公式
  3. 使用CNN进行RL的优点
  4. 给出了使用NN做RL的目标函数
    (下面的原文给出了基本的概念,并从传统的RL引入到使用CNN的RL。从Q(s,a)这种离散的学习方法引入到Q(s,a,theta)这种通过学习参数来获取目标值的连续拟合方法)
    在这里插入图片描述在这里插入图片描述
  5. 论文提出了experiment replay概念,在网络学习时不时的使用以前经历过的状态,来让学习更佳牢靠 smooth
  6. 论文给出了DQN的算法描述,并给出了DQN的优点
    在这里插入图片描述
  7. 最后论文给出了使用DQN完成游戏的网络学习设置,给出了实验和测评

猜你喜欢

转载自blog.csdn.net/travalscx/article/details/94547423
DQN