强化学习--概念之

其他 2018-11-07 17:12:54 阅读次数: 0

agent（代理，智能体）

增强学习要解决的是这样的问题：一个能感知环境的自治agent，怎样通过学习选择能达到其目标的最优动作。这个很具有普遍性的问题应用于学习控制移动机器人，在工厂中学习最优操作工序以及学习棋类对弈等。当agent在其环境中做出每个动作时，施教者会提供奖励或惩罚信息，以表示结果状态的正确与否。例如，在训练agent进行棋类对弈时，施教者可在游戏胜利时给出正回报，而在游戏失败时给出负回报，其他时候为零回报。agent的任务就是从这个非直接的，有延迟的回报中学习，以便后续的动作产生最大的累积效应。

视频游戏和机器人是机器学习得到应用的一个巨大领域。一般来说我们有一个Agent（游戏角色或机器人），它必须根据环境（视频游戏中的虚拟环境或者对于机器人来说的真实环境）来行动。
机器学习可以使这个Agent执行任务，比如移动到某个环境中而同时避开障碍或者敌人。在这些情形下一个最受欢迎的机器学习技术是强化学习，Agent通过学习环境的强化系数（如果Agent碰到了障碍物强化系数则为负，如果达到目标则为正）来执行任务。

猜你喜欢

转载自blog.csdn.net/wydbyxr/article/details/83650668

强化学习--概念之

强化学习基础之概念介绍

强化学习概念

强化学习--基础概念

漫谈深度强化学习之基础概念

【深度强化学习】强化学习的基本概念

强化学习之MDP

强化学习之Sarsa

强化学习之PPO

强化学习之DQN

强化学习之DDQN

强化学习之SAC

强化学习之TRPO

强化学习--综述3之强化学习的分类

重温强化学习之强化学习简介

重温强化学习之强化学习模拟平台

强化学习（RL）基本概念

强化学习基础概念笔记

强化学习（基本概念）

强化学习基本概念

（一）强化学习基本概念

强化学习：基本概念

强化学习是个啥概念？

强化学习-概念05：Imitation Learning

机器学习之监督学习，无监督学习，强化学习相关概念

机器学习之强化学习

【人工智能II笔记】初学强化学习之概念多多

强化学习（一）强化学习的基本概念、e贪心算法、Softmax算法

强化学习入门（一）强化学习的基础概念及Gym库，Parl库介绍

强化学习之Q-learning

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)