【Unity】机器学习ML-Agents术语 - 代码天地

【Unity】机器学习ML-Agents术语

其他 2018-07-10 01:13:20 阅读次数: 0

翻译自官方文档，转载请注明出处。

Academy - Unity组件，用来控制训练场景的时间设定、场景重置和训练/推理设置。
Action -环境中的代理(Agent)执行决策(Decision)的行为。
Agent - 在训练场景中执行观察(Observation)和行动(Action)的Unity组件，代理的行动由与之相连的大脑(Brain)做出的决策驱动。
Brain - 给和大脑连接的代理作出决策的Unity组件。
Decision - 对于被观察的行动，由大脑做出的行为规范。
Editor -包含很多功能面板 (e.g. Hierarchy, Scene, Inspector)的Unity编辑器。
Environment - 一个Unity场景，包含唯一的学院，一个或多个代理和与之相连的大脑。
FixedUpdate - Unity里每隔固定时间（默认0.02秒）执行一次的方法，ML-Agents的逻辑应该在这个方法里实现。
Frame - 主摄像机进行渲染并显示的一个实例，对应于游戏引擎每次调用的Update方法。
Observation - 为代理提供一部分训练环境状态信息。 (e.g. Vector, Visual, Text)
Policy - 由观察结果产生决策的方法。
Reward - 训练过程中每一步的反馈信号，用来判断代理在训练环境当前的状态下的行动对否符合预期。
State - 给定时间内训练环境的基本属性（包含其中所有的代理）。
Step - 对应引擎中每次调用的FixUpdate方法，反映的（可能）是最小的原子状态的变化。
Update - Unity每渲染一帧调用一次的方法，ML-Agents的逻辑不应该在Update里实现（因为渲染一帧的时长是不固定的）。
External Coordinator - 负责与外部进程通信的ML-Agents类 (本例中为Python API)。
Trainer - 负责训练外部大脑(External Brain)的Python类，包含为外部大脑做出决策的TensorFlow。

猜你喜欢

转载自blog.csdn.net/m0_38108745/article/details/79896782

【Unity】机器学习ML-Agents术语

Unity 机器学习(ML-Agents) 基础

【官方】Unity 机器学习 ML-Agents （三）使用Docker实现ML-Agents功能

Unity机器学习库ML-Agents快速配置

Unity的机器学习工具包ML-Agents

ML-Agents背景：机器学习

玩转Unity中的ML-Agents 机器学习（二）：Unity环境搭建

Unity 机器学习 ML-Agents （一）官方介绍概念【必读】

【官方】Unity 机器学习 ML-Agents （五）从头创建一个训练环境

【官方】Unity 机器学习 ML-Agents （四）3D Balance Ball 环境入门

【Unity】使用ML-Agents创建新的机器学习项目的流程

玩转Unity中的ML-Agents 机器学习（三）：BallacceBall 案例训练

玩转Unity中的ML-Agents 机器学习（一）：系统环境安装

Unity 用ml-agents机器学习造个游戏AI吧（DEMO示例）

Unity 用ml-agents机器学习造个游戏AI吧（环境配置）

Unity机器学习库ml-agents新版本的环境搭建

Unity机器学习 ML-Agents第一个例子

Unity强化学习之ML-Agents的使用

【官方】Unity 机器学习 ML-Agents （二）配置Unity机器学习代理工具和TensorFlow环境(Windows 10)

Unity ML-agents 一、初次尝试

Unity(ML-agents) for Imitaion Learning.

Unity 对接 ML-Agents 初探

ML-Agents概述

ML-Agents记录

Unity3D机器学习插件ML-Agents ToolKit(v0.5): 环境搭建和3DBallDemo运行

Unity之ml-agents（一）：环境配置及初步使用

Unity之ml-agents(二)：项目——小球追踪目标

Unity ML-Agents release12 环境搭建

Unity ML-Agents默认接口参数含义

ML-Agents案例之机器人学走路

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)