深度强化学习之DQN算法基础篇。

作者:禅与计算机程序设计艺术

1.简介

深度强化学习(Deep Reinforcement Learning, DRL)是利用机器学习技术来训练智能体(Agent)在复杂任务环境中进行持续、自动化的决策与执行。本文将主要介绍DQN,一个经典的基于模型的强化学习算法。DQN是一个用于处理离散动作空间和连续状态空间的问题的强化学习方法,通过学习与目标网络相结合的方式找到最优策略,可以有效解决大型复杂问题。

2.核心概念和术语

2.1 强化学习

强化学习的定义及其特点

强化学习(Reinforcement learning,RL)是指让机器或智能体能够从奖赏(reward)和惩罚(penalty)中学习到做出最佳行为的能力,这种能力可以促使机器或智能体在长期内获得远超过预期的回报。

强化学习是指机器学习领域中的一个重要研究方向,它旨在通过与环境的交互来学习并改善行动的机制,从而实现自我学习、自我进化、实现最大化回报等。强化学习可以由代理(agent)执行特定的动作,并接收来自环境反馈的信息,根据这一信息调整动作的选择,以期得到更好的结果。与其他类型的机器学习方法不同的是,强化学习系统不仅需要了解环境的状态,而且还要能够准确地预测未来的奖励和惩罚。为了使机器或智能体在长期内学会做出最优的决策,强化学习系统必须学习如何通过交互来积累经验并提高其学习效率。

强化学习具有五个主要特点:

  • 1.多步决策决策过程是连续的。每一个时刻,智能体都必须考虑

猜你喜欢

转载自blog.csdn.net/universsky2015/article/details/133004281