机器智能-高频问题：agent类型

1、agent就是能够行动的某种东西。

2、合理agent：当存在不确定性时，能够实现最佳期望结果而行动的agent

3、agent可以抽象地表示成方程：搜集信息，处理信息，行动

4、agent相当于与环境相互感知的对象，通过感知器感知环境序列并转化为行为，再通过执行器产生对环境的影响（感知器+执行器+之间的映射函数）

5、感知器（sensors）感知环境信息给agent，通过faction处理信息转化为行为给执行器（actuartors）反馈信息给环境

6、agent函数将任何感知历史数据映射为行为，agent程序通过物理系统上运行来实现agent函数，agent=体系结构（sensor+actor）+程序，即软件和硬件

7、agent程序：
a、以传感器得到的当前感知信息为输入
b、以执行器的行为为输出
c、仅仅以当前感知为输入而不是整个历史感知为输入

8、理性agent：对于每一个可能的感知数据序列，一个理性的agent应该采取一个行为已达到最大的性能，即必须是agent+产生最大性能
a、一个agent应该根据他感知的信息产生一个行为
b、给行为是正确的，也就是说能产生最大的性能

9、理性判断的四个因素：先验知识，可以完成的行动，截止到此刻的感知序列，性能度量
a、训练集数据是提供先验知识的东西
b、训练出来的模型是agent程序

10、agent四种类型：简单反射，基于模型，基于目标，基于效用，依次递进，环境越来越复杂

11、简单反射agent：基于当前的感知选择行动，不关注历史信息；当前状态+当前感知（仅考虑前车刹车灯的刹车问题）

12、基于模型的反射agent：agent根据感知历史维持内部状态，agent随时更新内部状态信息；当前状态=当前感知+上一时刻状态（+上一时刻行动）（在上问题的基础上考虑了距离前车距离的刹车问题）

13、基于目标的agent：除了根据感知信息以外还有根据目标采取行动；当前行动=当前状态+当前目标。效率低，需要推理（在上问题的基础上考虑了路况<十字路口>和行驶计划的刹车问题）

14、基于效用的agent：当达到目标的行为有很多种的时候，还需要考虑效率，相当于决定行为时加入效用衡量因素

15、学习agent：有评价和创新功能的agent，即一个可以学习和修改权值的agent。四个组件（critic、learning element、performance element、problem generator<给建议，给一个创新的方案>）

发布了275 篇原创文章 · 获赞 160 · 访问量 4万+

私信关注