文章目录

1. 主体模型（Agent-based model）
2. 智能体模型（Intelligent agent model）

1. 主体模型（Agent-based model）

主体模型、基于主体的模型或智能体模型（对于 agent-based model（ABM））是一种计算模型，用于模拟自主主体（个人（individual）或集体实体（collective entities），如组织（organizations）或团体（groups））的行为和相互作用，以了解系统的行为以及控制其结果的因素。

翻译成“主体模型或智能体模型”，既区别于个体（individual），又区别于代理人，是一种可人为定义的，具有一定自身性质和相互作用性质的抽象对象。另外智能体模型应该为“Intelligent agent model”翻译的结果，为了以示区别，后续将“agent-based model”翻译为主体模型或基于主体的模型。

图 agent-based model 在百度翻译中的结果

它结合了博弈论、复杂系统、涌现（emergence）、计算社会学（computational sociology）、多主体系统（multi-agent systems）和进化编程（evolutionary programming）的元素。蒙特卡罗方法用于理解这些模型的随机性。特别是在生态学中，ABM 也被称为基于个体的模型（individual-based models，IBM）。对最近关于基于个体的模型、主体模型和多主体系统的文献的回顾表明，ABM 被用于许多科学领域，包括生物学、生态学和社会科学。主体模型与多主体系统（multi-agent systems）或多主体模拟（multi-agent simulation）的概念相关但不同，因为 ABM 的目标是寻找对遵循简单规则的主体的集体行为的解释性洞察，通常在自然系统中，而不是设计主体或解决特定的实际或工程问题。

主体模型是一种微型模型，它模拟多个主体的同时操作和相互作用，以尝试重新创建和预测复杂现象的出现。这一过程是一种涌现，有人将其表述为“整体大于部分之和”。换句话说，较高层次的系统属性来自较低层次子系统的相互作用。或者，宏观尺度的状态变化来自微观尺度的主体行为。或者，简单的行为（意味着主体遵循的规则）产生复杂的行为（意味着整个系统级别的状态变化）。

个体主体（individual agents）通常被描述为有限理性（boundedly rational），被假定为按照他们认为自己的利益行事，例如繁殖、经济利益或社会地位，使用启发式或简单的决策规则。 ABM 主体可能会经历“学习”、适应和复制。

大多数主体模型由以下部分组成：（1）以不同规模指定的大量主体（通常称为主体粒度（agent-granularity））； (2) 决策启发式； (3) 学习规则或适应过程； (4) 交互拓扑（interaction topology）； (5)环境。 ABM 通常作为计算机模拟实现，或者作为定制软件，或者通过 ABM 工具包，然后该软件可用于测试个体行为的变化将如何影响系统涌现的整体行为。

1.1 历史

基于主体的建模的想法是在 1940 年代后期作为一个相对简单的概念发展起来的。由于它需要大量的计算，因此直到 1990 年代才普及。

1.1.1 早期发展

主体模型的历史可以追溯到冯诺依曼机器，一种能够复制的理论机器。冯诺依曼提出的装置将遵循精确的详细说明来制作它自己的副本。冯·诺依曼的朋友 Stanislaw Ulam 也是一位数学家，后来建立了这个概念。Ulam 建议将机器构建在纸上，作为网格上的一组单元格。这个想法引起了冯诺依曼的兴趣，他提出了这个想法——创造了第一个后来被称为元胞自动机（cellular automata）的设备。数学家 John Conway 介绍了另一个进步。他构建了著名的生命游戏。与冯诺依曼的机器不同，Conway 的生命游戏以二维棋盘形式的虚拟世界中的简单规则运行。

Simula 编程语言于 1960 年代中期开发并在 1970 年代初广泛实施，是第一个用于自动执行分步主体模拟（automating step-by-step agent simulations）的框架。

1.1.2 1970 年代和 1980 年代：第一批模型

最早的主体概念模型之一是 Thomas Schelling 的 segregation model，在他 1971 年的论文“Dynamic Models of Segregation”中进行了讨论。虽然 Schelling 最初使用硬币和方格纸而不是计算机，但他的模型体现了主体模型的基本概念，即在共享环境中相互作用的自主主体（autonomous agents），最终可以观察到聚合（aggregate）、涌现（emergent）的现象。

在 1980 年代初期，Robert Axelrod 举办了一场囚徒困境（Prisoner’s Diemma）策略锦标赛，并让他们以基于主体的方式进行互动以确定获胜者。Axelrod 将继续在政治科学领域开发许多其他基于主体的模型，这些模型检查从种族中心主义到文化传播的现象。到 1980 年代后期，Craig Reynolds 在 flocking models 方面的工作促成了一些包含社会特征的第一个基于生物主体的模型的开发。他试图模拟活跃的现实的生物主体，称为人工生命（artificial life），这是 Christopher Langton。

“主体”一词的第一次使用和目前使用的定义很难追查。一位可能人选似乎是 John Holland 和 John H. Miller 的 1991 年论文“Artificial Adaptive Agents in Economic Theory”，这个判断基于他们之前的会议介绍。

与此同时，在 1980 年代，社会科学家、数学家、运筹学研究人员以及来自其他学科的一小部分人发展了计算和数学组织理论（Computational and Mathematical Organization Theory，CMOT）。该领域作为管理科学研究所（The Institute of Management Sciences，TIMS）及其姊妹协会美国运筹学协会（the Operations Research Society of America，ORSA）的一个特殊兴趣小组而发展壮大。

1.1.3 1990 年代：扩张

1990 年代尤其值得注意的是 ABM 在社会科学中的扩展，其中一项值得注意的努力是由 Joshua M. Epstein 和 Robert Axtell 开发的大规模 ABM，Sugarscape，用于模拟和探索诸如季节性迁移等社会现象的作用，污染、有性生殖、对抗和疾病甚至文化的传播。1990 年代其他值得注意的发展包括卡内基梅隆大学的 Kathleen Carley ABM，以探索社交网络和文化的共同进化。在 1990 年代期间，Nigel Gilbert 出版了第一本关于社会模拟的教科书：Simulation for the social scientist（1999 年），并从社会科学的角度创办了一本期刊：the Journal of Artificial Societies and Social Simulation（JASSS）。除了 JASSS，任何学科的主体模型都在 SpringerOpen 期刊 Complex Adaptive Systems Modeling（CASM）。

到 1990 年代中期，ABM 的社会科学主线开始关注设计有效团队（effective teams）、理解组织有效性所需的沟通以及社交网络行为等问题。 CMOT（后来更名为 Computational Analysis of Social and Organizational Systems（CASOS）），结合了越来越多的基于主体的建模。 Samuelson（2000）是对早期历史的简要概述，Samuelson（2005）以及 Samuelson 和 Macal（2006）追溯了最近的发展。

在 1990 年代后期，TIMS 和 ORSA 合并形成 INFORMS，INFORMS 将每年举行两次会议改为一次，这有助于推动 CMOT 小组成立一个独立的协会，即北美计算社会和组织科学协会（the North American Association for Computational Social and Organizational Sciences，NAACSOS）。 Kathleen Carley 是主要贡献者，特别是对社交网络模型的贡献，获得了国家科学基金会年度会议的资助，并担任 NAACSOS 的第一任主席。她的继任者是芝加哥大学和阿贡国家实验室的 David Sallach，然后是埃默里大学的 Michael Prietula。大约在 NAACSOS 开始的同时，组织了 NAACSOS 的对应机构欧洲社会模拟协会（the European Social Simulation Association，ESSA）和 the Pacific Asian Association for Agent-Based Approach in Social Systems Science（PAAA）。截至 2013 年，这三个组织在国际上开展合作。第一届世界社会模拟大会（The First World Congress on Social Simulation）于 2006 年 8 月在日本京都的联合赞助下举行。第二届世界大会于 2008 年 7 月在华盛顿特区北弗吉尼亚郊区与乔治梅森大学举行，后者在地方安排中发挥主导作用。

1.1.4 2000 年代及以后

最近，Ron Sun 开发了基于人类认知模型的基于主体的模拟的方法，称为认知社会模拟（cognitive social simulation）。加州大学洛杉矶分校的 Bill McKelvey、Suzanne Lohmann、Dario Nardi、Dwight Read 等人也在组织行为（organizational behavior）和决策制定（decision-making）方面做出了重大贡献。自 2001 年以来，加州大学洛杉矶分校在加利福尼亚州 Lake Arrowhead 安排了一次会议，该会议已成为该领域从业者的另一个主要聚集点。

1.2 理论

大多数计算建模研究将系统描述为处于平衡状态或在平衡状态之间变动。然而，基于主体的建模，使用简单的规则，可以产生不同类型的复杂和有趣的行为。主体模型的三个核心思想是作为对象的主体（agents）、涌现（emergence）和复杂性（complexity）。

主体模型由动态相互作用的基于规则的主体组成。它们交互的系统可以创建类似于现实世界的复杂性。通常主体位于空间和时间中，并驻留在网络或格状邻域中。主体的位置及其响应行为在计算机程序中以算法形式编码。在某些情况下，尽管并非总是如此，主体可能被认为是聪明和有目的的。在生态 ABM（通常称为生态学中的“基于个体的模型”）中，主体可能例如是森林中的树，并且不会被认为是智能的，尽管它们在优化访问（optimizing access）某一资源（如水）的意义上可能是“有目的的”。最好将建模过程描述为归纳（inductive）。建模者做出与当前情况最相关假设，然后观察主体交互中出现的现象。有时，这种结果是一种平衡。有时它是一种涌现模式（emergence pattern）。然而，有时它是一种难以理解的混乱。

在某些方面，主体模型补充了传统的分析方法。在分析方法使人类能够表征系统的平衡的情况下，主体模型允许生成这些平衡的可能性。这种生成贡献可能是基于主体的建模的潜在好处中最主流的。主体模型可以解释高阶模式（higher-order patterns）的出现——恐怖组织和互联网的网络结构、交通拥堵、战争和股市崩盘规模的幂律分布，以及尽管人口众多但仍然存在的社会隔离宽容的人。基于主体的模型也可用于识别杠杆点（lever point），后者定义为干预具有极端后果的时刻，并区分路径依赖的类型。

许多模型不关注稳定状态，而是考虑系统的鲁棒性——复杂系统适应内部和外部压力以维持其功能的方式。利用这种复杂性的任务需要考虑主体本身——它们的多样性、连通性（connectedness）和交互水平。

1.2.1 框架

最近关于复杂自适应系统的建模和仿真的工作表明需要结合基于主体和基于复杂网络的模型。描述一个框架，该框架由四个层次的复杂自适应系统开发模型组成，使用几个示例多学科案例研究来描述：

复杂网络建模级别，用于开发使用各种系统成分交互数据的模型。
探索性的基于主体的建模级别，用于开发主体模型以评估进一步研究的可行性。这可以，例如，对于开发概念验证模型（例如资助申请）很有用，而无需研究人员进行广泛的学习曲线。
描述性基于主体的建模（Descriptive Agent-based Modeling，DREAM），用于通过使用模板和复杂的基于网络的模型来开发主体模型的描述。构建 DREAM 模型允许跨科学学科进行模型比较。
使用 Virtual Overlay Multiagent system（VOMAS）进行验证的基于主体的建模，以正式方式用于验证的开发过程和验证的模型。

描述主体模型的其他方法包括代码模板（code template）和基于文本的方法（text-based methods），例如 ODD（Overview，Design，Concepts，Design Details，即概述、设计概念和设计细节）协议。

椎体所在的环境的作用，无论是宏观的还是微观的，也正在成为基于主体的建模和模拟工作的重要因素。简单的环境承载了简单的主体，但复杂的环境产生了行为的多样性。

1.2.2 多尺度建模

基于主体的建模的优势之一是它能够调解尺度之间的信息流。当需要有关主体的其他详细信息时，研究人员可以将其与描述额外详细信息的模型集成。当人们对主体群体表现出的涌现行为感兴趣时，他们可以将主体模型与描述群体动态的连续模型结合起来。例如，在一项关于 CD4+ T 细胞（适应性免疫系统中的关键细胞类型）的研究中，研究人员模拟了发生在不同空间（细胞内、细胞和系统）、时间和组织尺度（信号转导、基因调控、代谢、细胞行为和细胞因子转运）。在得到的模块化模型中，信号转导和基因调控由逻辑模型（logical model）描述，代谢由基于约束的模型（constraint-based models）描述，细胞群动态由基于主体的模型描述，全身细胞因子浓度由常微分方程描述。在这个多尺度模型中，主体模型占据中心位置，并协调各尺度之间的每个信息流。

1.3 应用

1.3.1 在复杂的自适应系统建模中

我们生活在一个非常复杂的世界中，我们面临着复杂的现象，例如社会规则的形成和新的颠覆性技术的出现。为了更好地理解这种现象，社会科学家经常使用简化方法，他们将复杂系统简化为低杠杆变量（ lower-lever variables），并通过诸如偏微分方程等方程组对它们之间的关系进行建模。这种称为基于方程的建模（equation-based modeling，EBM）的方法在对真实复杂系统进行建模时存在一些基本弱点。EBM 强调不切实际的假设，例如无限理性（unbounded rationality）和完美信息（perfect information），而适应性（adaptability）、可进化性（evolvability）和网络效应（network effects）却没有得到解决。在解决还原论（reductionism）的缺陷时，复杂自适应系统（complex adaptive system，CAS）的框架在过去的二十年中被证明非常有影响力。与还原论相反，在 CAS 框架中，复杂现象以有机方式进行研究，其中它们的主体应该是有限理性（boundedly rational）和适应性的（adaptive）。作为一种强大的 CAS 建模方法，基于主体的建模在学术界和从业者中越来越受欢迎。ABM 展示了主体的简单行为规则及其在微观尺度上的局部交互，如何在宏观尺度上产生令人惊讶的复杂模式。

1.3.2 在生物学中

基于主体的建模已广泛用于生物学，包括分析流行病的传播、和生物战的威胁、包括种群动力学在内的生物学应用、随机基因表达、植物-动物相互作用、植被生态学，景观多样性，社会生物学，古代文明的兴衰，民族中心行为的演变，被迫迁移/迁移，语言选择动力学（language choice dynamics），认知建模和生物医学应用，包括建模 3D 乳腺组织形成/形态发生，电离辐射对乳腺干细胞亚群动态的影响，炎症（inflammation），和人体免疫系统。主体模型也被用于开发决策支持系统（decision supportsystems），例如乳腺癌。主体模型越来越多地用于在早期和临床前研究中对药理学系统进行建模，以帮助药物开发并获得对不可能先验认知的生物系统的理解。军事应用上也得到了评估。此外，主体模型最近已被用于研究分子水平的生物系统。还编写了主体模型来描述古代系统中起作用的生态过程，例如恐龙环境和更近期的古代系统中的生态过程。

1.3.3 在流行病学中

主体模型现在补充了传统的分室模型（compartmental models），即通常类型的流行病学模型（epidemiological models）。在预测的准确性方面，ABM 已被证明优于分室模型。最近，流行病学家 Neil Ferguson 的 CovidSim 等 ABM 已被用于告知公共卫生（非药物）干预措施以防止 SARS-CoV-2 的传播。流行病学 ABM 因简化和不切实际的假设而受到批评。尽管如此，在精确校准 ABM 的情况下，它们仍可用于为有关缓解和抑制措施的决策提供信息。

1.3.4 在商业、技术和网络理论方面

自 1990 年代中期以来，主体模型已被用于解决各种业务和技术问题。应用示例包括营销、组织行为和认知、团队合作、供应链优化和物流、消费者行为建模，包括口碑、社交网络效应、分布式计算、劳动力管理和投资组合管理。它们还被用于分析交通拥堵。

最近，基于主体的建模和模拟已应用于各个领域，例如研究计算机科学领域（期刊与会议）研究人员对出版场所的影响。此外，ABM 已被用于模拟环境辅助环境中（ambient assisted environments）的信息传递。arXiv 上 2016 年 11 月的一篇文章分析了基于主体的 Facebook 上散布帖子的模拟。在点对点、自组织和其他自组织和复杂网络领域，基于主体的建模和模拟的有用性已经得到展示。最近已经验证了使用基于计算机科学的正式规范框架与无线传感器网络和基于主体的模拟相结合的可行性。

基于主体的进化搜索或算法是解决复杂优化问题的新研究课题。

1.3.5 在经济和社会科学中

在 2008 年金融危机之前和之后，ABM 作为经济分析的可能工具越来越受到关注。ABM 不假设经济可以达到平衡，“代表主体（representative agents）”被具有多样化、动态和相互依赖行为的主体所取代，包括从众行为（herding）。 ABM 采用“自下而上（bottom-up）”的方法，可以生成极其复杂和波动的模拟经济。 ABM 可以代表不稳定的系统，其崩溃和繁荣是由对成比例的小变化的非线性（不成比例）响应发展而来的。《经济学人》2010 年 7 月的一篇文章将 ABM 视为 DSGE 模型的替代品。《自然》杂志还鼓励基于主体的建模，其社论建议 ABM 可以比标准模型更好地代表金融市场和其他经济复杂性。J. Doyne Farmer 和 Duncan Foley 的一篇文章，认为 ABM 可以满足凯恩斯代表复杂经济和罗伯特卢卡斯基于微观基础构建模型的愿望。Farmer 和 Foley 指出了使用 ABM 对经济的各个部分进行建模所取得的进展，但他们主张创建一个包含低级模型（low level models）的非常大的模型。通过基于三种不同的行为特征（模仿、反模仿和冷漠）对复杂的分析师系统进行建模，金融市场被高精度模拟。结果表明网络形态与股票市场指数之间存在相关性。然而，ABM 方法因其模型之间缺乏鲁棒性而受到批评，其中相似的模型可能会产生非常不同的结果。

ABM 已被部署在建筑和城市规划中，以评估设计和模拟城市环境中的人流以及检查公共政策在土地使用方面的应用。利用 ABM 辨别对社会经济网络的系统性影响的能力，基础设施投资影响的社会经济分析领域也在不断发展。异质性和动态可以很容易地在 ABM 模型中构建，以解决财富不平等和社会流动性问题。

1.3.5.1 在经济学中

在经济学中，agent（主体）是经济某些方面模型中的参与者（更具体地说，是决策者）。通常，每个主体都通过解决定义明确的优化或选择问题来做出决策。

例如，买方（消费者）和卖方（生产者）是单一市场部分均衡模型中两种常见的主体类型。宏观经济模型，尤其是明确基于微观基础的动态随机一般均衡模型，通常将家庭、企业和政府或中央银行区分为经济中的主要主体类型。这些主体中的每一个都可能在经济中扮演多种角色；例如，家庭可能在模型中充当消费者、工人和选民。一些宏观经济模型区分了更多类型的主体，例如工人和购物者或商业银行。

主体一词也用于委托主体（principal-agent）模型；在这种情况下，它特指被委托代表委托人行事的人。

在基于主体的计算经济学（agent-based computational economics）中，相应的主体是在空间和时间上“建模为根据规则进行交互的计算对象（computational objects）”，而不是真实的人。制定规则是为了根据规定的激励和信息对行为和社会互动进行建模。主体的概念可以广义地解释为在动态多主体经济系统（dynamic multi-agent economic system）的背景下与其他此类实体交互的任何持久的个人（persistent individual）、社会、生物或物理实体。

1.3.5.2 代表与异质主体（Representative vs. heterogenous agents）

假定给定类型的所有主体（例如所有消费者或所有公司）完全相同的经济模型称为代表性主体模型（representative agent model）。区分代理人之间差异的模型称为异质主体模型（heterogeneous agent）。当经济学家想用最简单的术语描述经济时，他们经常使用代表性主体模型。相反，当主体之间的差异与手头的问题直接相关时，他们可能不得不使用异质主体模型。例如，在用于研究养老金经济影响的模型中可能需要考虑年龄的异质性；在用于研究预防性储蓄或再分配税收的模型中可能需要考虑财富的异质性。

1.3.6 在水资源管理中

ABM 也被应用于水资源规划和管理，特别是用于探索、模拟和预测基础设施设计和政策决策的性能，以及评估大型水资源系统中合作和信息交换的价值。

1.3.7 有组织的 ABM：主体导向模拟（Organizational ABM: agent-directed simulation）

利用主体导向模拟（ADS）的比喻可以将系统分为两类，即“Systems for Agents”和“Agents for Systems”。Systems for Agents（有时称为 agents systems）是系统实现主体（systems implementing agents），用于工程、人类和社会动力学、军事应用等。Agents for Systems 分为两个子类别。Agents-surpported systems 处理使用主体作为支持设备（surpport facility），以使计算机辅助解决问题或增强认知能力。基于主体的系统专注于在系统评估（系统研究和分析）中使用主体来进行模型演化行为。

1.3.8 自动驾驶汽车

Hallerbach 等人。通过被测车辆的数字孪生和基于独立主体的微观交通模拟，讨论了基于主体的方法在自动驾驶系统的开发和验证中的应用。Waymo 创建了一个多智能体模拟环境 Carcraft 来测试自动驾驶汽车的算法。它模拟人类驾驶员、行人和自动驾驶汽车之间的交通交互。人们的行为是由人工主体根据真实人类行为的数据来模仿的。早在 2003 年就讨论了使用基于主体的建模来理解自动驾驶汽车的基本思想。

1.4 算法实现

许多 ABM 框架是为串行 von-Neumann 计算机架构设计的，限制了实现模型的速度和可扩展性。由于大规模 ABM 中的涌现行为取决于群体规模，规模限制可能会阻碍模型验证。这些限制主要通过分布式计算得到解决，诸如 Repast HPC等框架专门用于这些类型的实现。虽然这些方法很好地映射到集群和超级计算机架构，但与通信和同步相关的问题以及部署复杂性仍然是其广泛采用的潜在障碍。

最近的一项发展是在图形处理单元 GPU 上使用数据并行算法进行 ABM 模拟。极高的内存带宽与多处理器 GPU 的绝对数字处理能力相结合，能够以每秒数十帧的速度模拟数百万个代理。

1.4.1 与其他建模形式集成

由于基于主体的建模更像是一个建模框架，而不是特定的软件或平台，因此它经常与其他建模形式结合使用。例如，基于主体的模型也已与地理信息系统（Geographic Information System，GIS）相结合。这提供了一个有用的组合，其中 ABM 用作过程模型，而 GIS 系统可以提供模式模型。同样，有时会集成社交网络分析（Social Network Analysis，SNA）工具和主体模型，其中 ABM 用于模拟网络上的动态，而 SNA 工具对交互网络进行建模和分析。

1.5 验证和确认（Verification and validation，V&V）

仿真模型的验证和确认（Verification and validation，V&V）非常重要。验证（Verification）涉及确保实现的模型与概念模型匹配，而确认（validation）确保实现的模型与现实世界有某种关系。人脸验证、敏感性分析、校准和统计验证是验证的不同方面。已经有人提出了一种用于验证基于主体的系统的离散事件模拟框架方法。可以在此处找到有关主体模型的经验验证的综合资源。

作为 V&V 技术的一个例子，考虑 VOMAS（virtual overlay multi-agent system，虚拟覆盖多代理系统），一种基于软件工程的方法，其中虚拟覆盖多主体系统与主体模型一起开发。Muazi 等人还提供了一个使用 VOMAS 验证和确认森林火灾模拟模型的示例。另一种软件工程方法，即测试驱动开发已适用于主体模型验证。这种方法还有另一个优点，它允许使用单元测试工具进行自动验证。

2. 智能体模型（Intelligent agent model）

在人工智能中，智能体（intelligent agent，IA）是感知其环境、自主采取行动以实现目标，并可以通过学习或使用知识来提高其性能的任何事物。它们可能是简单的或复杂的——恒温器（thermostat）被认为是智能体的一个例子，就像人类一样，任何符合定义的系统也是如此，例如公司、国家或生物群落。

图简单的反射体（reflex agent）图示

领先的 AI 教科书将“人工智能”定义为“智能体的研究和设计”，这一定义将目标导向的行为（goal-directed behavior）视为智能的本质。还使用从经济学中借用的术语“理性主体（rational agent）”来描述目标导向主体。

主体具有封装智能体所有目标的“目标函数”。这样的主体旨在创建和执行任何计划，一旦完成，目标函数的期望值就会最大化。例如，强化学习主体具有“奖励函数”，允许程序员塑造智能体的期望行为（desired behavior），进化算法的行为由“适应函数（fitness function）”塑造。

人工智能中的智能体与经济学中的主体（agents）密切相关，智能体范式的版本在认知科学、伦理学、实践理性哲学以及许多跨学科的社会认知建模和计算机社会模拟中都有研究。

智能体通常被示意性地描述为类似于计算机程序的抽象功能系统。智能体的抽象描述称为抽象智能体（abstract intelligent agents，AIA），以将它们与现实世界的实现（implementations）区分开来。自主智能体（autonomous intelligent agent）旨在在没有人为干预的情况下运行。智能体也与软件代理（software agents，代表用户执行任务的自主计算机程序）密切相关。

2.1 人工智能的定义

计算机科学将人工智能研究定义为对智能体的研究。较新的 AI 教科书将“主体（agent）”定义为：

“任何可以被视为通过传感器感知环境并通过执行器作用于该环境的事物”

将“理性代理（rational agent）”定义为：

“根据过去的经验和知识，最大限度地提高在某一性能度量下的期望值的主体。”

并将“人工智能”研究领域定义为：

“理性主体的研究与设计”

Kaplan 和 Haenlein 给出了类似的 AI 定义：“系统正确解释外部数据、从此类数据中学习以及通过灵活适应，使用这些学习来实现特定目标和任务的能力。”

Padgham & Winikoff（2005）赞同智能体位于环境中，并及时（尽管不一定实时）响应环境变化。然而，智能体还必须以灵活和稳健的方式主动追求目标。可选要求包括主体是理性的，以及主体能够进行信念-愿望-意图（belief-desire-intention）分析。

2.1.1 此定义的优点

从哲学上讲，它避免了几条批评。与图灵测试不同，它不以任何方式提及人类智能。因此没有必要讨论它是“真实的”还是“模拟的”智能（即“合成（synthetic）”智能还是“人工（artificial）”智能），也并不表明这样的机器有思想（mind）、意识（consciousness）或真正的理解（understanding）（即，它并不意味着 John Searle 的“强人工智能假设（strong AI hypothesis）”）。它也没有试图在“智能”行为和“非智能”行为之间划出一条清晰的分界线——程序只需要根据它们的目标函数来衡量。

更重要的是，它具有许多有助于推动人工智能研究向前发展的实际优势。它提供了一种可靠和科学的方式来测试程序；研究人员可以通过询问哪个主体最擅长最大化给定的“目标函数”来直接比较，甚至组合不同的方法来解决孤立的问题。它还为他们提供了一种与其他领域交流的通用语言——例如数学优化（根据“目标”定义）或经济学（使用相同的“理性主体”定义）。

2.2 目标函数

一个被分配了明确的“目标函数”的智能体，如果它始终如一地采取行动，成功地最大化其编程的目标函数，则被认为是更聪明的。目标可以很简单（“如果智能体赢得围棋比赛，则为 1，否则为 0”）或复杂（“执行与过去成功的数学相似的动作”）。 “目标函数”封装了主体被驱动采取行动的所有目标；在理性主体的情况下，该函数还封装了在实现相互冲突的目标之间可接受的权衡。（术语各不相同；例如，一些主体寻求最大化或最小化“效用函数（utility funciton）”、“目标函数（objective funciton）”或“损失函数（loss function）”。）

可以明确定义或诱导目标。如果 AI 被编程为“强化学习（reinforcement learning）”，那么它具有“奖励函数（reward function）”，可以鼓励某些类型的行为并惩罚其他类型的行为。或者，进化系统可以通过使用“适应函数”来变异和优先复制高分人工智能系统来诱导目标，类似于动物如何进化为天生渴望某些目标，例如寻找食物。一些人工智能系统，例如最近邻（nearest-neighbor），而不是类比推理，这些系统通常没有目标，除非目标隐含在其训练数据中。如果将非目标系统构建为“目标”是完成其狭窄分类任务的系统，则此类系统仍然可以进行基准测试（benchmarked）。

传统上不被视为主体的系统，例如知识表示系统（knowledge representation systems），有时通过将它们构建为具有（例如）尽可能准确地回答问题的目标的主体而被纳入范式； “行动（action）”的概念在这里被扩展为包括回答问题的“行动（act）”。作为一个额外的扩展，模仿驱动系统（mimicry-driven systems）可以被构建为优化“目标函数”的主体，“目标函数”基于智能体成功模仿所需行为的相似程度。在 2010 年代的生成对抗网络（generative adversarial networks）中，“编码器（encoder）”/“生成器（generator）”组件试图模仿和即兴创作人类文本。生成器试图最大化一个函数，该函数封装了它可以如何欺骗一个敌对的“预测器（predictor）”/“鉴别器（discriminator）”组件。

虽然 GOFAI 系统通常接受明确的目标函数，但该范式也可以应用于神经网络和进化计算。强化学习可以生成智能主体，这些主体似乎以旨在最大化“奖励函数”的方式行事。有时，机器学习程序员不是将奖励函数设置为直接等于所需的基准评估函数（benchmark evaluation function），而是使用奖励塑造（reward shaping），在开始时给予机器奖励以奖励学习中的增量进步（incremental progress）。Yann LeCun 在 2018 年表示，“人们提出的大多数学习算法本质上都是最小化一些目标函数。” AlphaZero 国际象棋有一个简单的目标函数；每场胜利计为 +1 分，每场失败计为 -1 分。自动驾驶汽车的目标函数必须更复杂。进化计算可以进化出智能主体，这些主体似乎以旨在最大化“拟合函数（fitness function）”的方式行事，该功能影响每个主体被允许留下多少后代。

理论上和不可计算的 AIXI 设计是该范式中的最大智能主体；然而，在现实世界中，智能体受到有限时间和硬件资源的限制，科学家们竞相产生可以在基准测试中取得越来越高分数的算法，基准测试使用真实世界的硬件进行计算。

2.3 智能体的类别

2.3.1 Russel 和 Norvig 的分类

Russell & Norvig（2003）根据智能体的感知程度和能力将其分为五类：

2.3.1.1 简单反射体（simple reflex agents）

图简单的反射体（reflex agent）

简单的反射体仅根据当前感知采取行动，而忽略感知历史的其余部分。主体功能基于条件-动作规则（condition-action rule）：“如果满足条件，则动作”。

只有当环境完全可观察时，此主体功能才会成功。一些反射体还可以包含有关其当前状态的信息，这使它们可以忽略执行器已被触发的条件。

对于在部分可观察环境中操作的简单反射体，无限循环通常是不可避免的。如果主体可以随机化其动作，就有可能摆脱无限循环。

2.3.1.2 基于模型的反射体（Model-based reflex agent）

图基于模型的反射体

基于模型的主体可以处理部分可观察的环境。它的当前状态存储在主体内部，维护着某种结构，描述了无法看到的世界其余的部分。这种关于“世界如何运作（how the world works）”的知识被称为世界模型（model of the world），因此被称为“基于模型的主体（model-based agent）”。

基于模型的反射体应该维护某种依赖于感知历史的内部模型，从而至少反映当前状态的一些未观察到的方面。感知历史和行动对环境的影响可以通过使用内部模型来确定。然后它以与反射体相同的方式选择一个动作。

主体也可以使用模型来描述和预测环境中其他主体的行为。

2.3.1.3 基于目标的代理（Goal-based agents）

图基于模型、基于目标的主体

基于目标的主体通过使用“目标”信息进一步扩展了基于模型的主体的能力。目标信息描述了理想的情况。这为主体提供了一种在多种可能性中进行选择的方法，选择达到目标状态的一种。搜索和规划是人工智能的子领域，致力于寻找实现主体目标的动作序列。

2.3.1.4 基于效用的主体（Utility-based agents）

图基于模型、基于效用的主体

基于目标的主体只区分目标状态和非目标状态。也可以定义特定状态的可取程度的度量。该度量可以通过使用效用函数（utility function）来获得，该效用函数将状态映射到状态效用的度量。更通用的性能度量应该允许根据不同世界状态对主体目标的满足程度进行比较。效用一词可用于描述主体的“快乐（happy）”程度。

一个理性的基于效用的主体选择最大化行动结果的预期效用的行动——即，在给定每个结果的概率和效用的情况下，主体平均期望得到什么。基于效用的主体必须对其环境进行建模和跟踪，这些任务涉及对感知、表示、推理和学习的大量研究。

2.3.1.5 学习体（Learning agents）

图通用学习体

学习的优势在于它允许智能体最初在未知环境中运行，并且比其初始知识本身可能允许的能力更强。最重要的区别在于负责改进的“学习要素（learning element）”和负责选择外部行动的“性能要素（performance element）”。

学习元素使用“批评者（critic）”对智能体表现的反馈，并确定应该如何修改性能元素或“演员（actor）”以在未来做得更好。性能元素是我们之前认为的整个主体：它接受感知并决定行动。

学习体的最后一个组件是“问题生成器（problem generator）”。它负责建议下一步的行动，行动将导致新的和信息丰富的体验。

2.3.2 Weiss的分类

Weiss（2013）定义了四类主体：

基于逻辑的主体——通过逻辑推理来决定执行什么动作；
反应性主体——决策以某种形式从情况到行动的直接映射来实施；
信念-愿望-意图（belief-desire-intention）主体——决策依赖于对代表主体的信念、愿望和意图的数据结构的操作；最后，
分层架构（layered architectures）——决策是通过各种软件层实现的，每个软件层或多或少都明确地推理不同抽象级别的环境。

2.4 主体的层次结构（Hierarchies of agents）

为了积极执行它们的功能，今天的智能体通常聚集在一个包含许多“子主体”的层次结构中。智能子主体处理和执行较低级别的功能。总之，智能体和子主体创建了一个完整的系统，可以通过表现出某种智能形式的行为和响应来完成困难的任务或目标。

通常，可以通过将身体分为传感器和执行器来构建主体，以便它与复杂的感知系统一起运行，该系统将世界的描述作为控制器的输入并将命令输出到执行器。然而，控制器层的层次结构通常是必要的，以平衡低级任务所需的即时反应和复杂的高级目标的缓慢推理。

2.4.1 主体函数（Agent function）

一个简单的主体程序可以在数学上定义为一个函数 $f$ （称为“主体函数”），它将每个可能的感知序列映射到主体可以执行的可能动作或影响的系数、反馈元素、函数或常数，而反映出最终行动：

$f:P^{\ast }\rightarrow A$

主体函数是一个抽象概念，因为它可以包含各种决策原则，例如计算个体选项的效用、逻辑规则的推导、模糊逻辑等。

相反，程序主体将每一个可能的感知映射到一个动作。

我们使用术语“感知”来指代主体在任何给定时刻的感知输入。代理是可以被视为通过传感器感知其环境并通过执行器对该环境起作用的任何事物。

2.5 应用

图在网页上提供自动化客户服务的自动化在线助理示例。

智能主体被用作自动化的在线助手，它们的作用是感知客户的需求，以执行个性化的客户服务。这样的主体可能基本上由一个对话系统、一个化身以及一个专家系统组成，为用户提供特定的专业知识。它们还可以用于优化在线人群的协调。Hallerbach 等人。通过被测车辆的数字孪生和基于独立主体的微观交通模拟，讨论了基于主体的方法在自动驾驶系统的开发和验证中的应用。Waymo 创建了一个多智能体模拟环境 Carcraft 来测试自动驾驶汽车的算法。它模拟人类驾驶员、行人和自动驾驶汽车之间的交通交互。人们的行为是由人工主体根据真实人类行为的数据来模仿的。早在 2003 年就讨论了使用基于代理的建模来理解自动驾驶汽车的基本思想。

2.6 其他定义和用途

“智能体”也经常被用作一个模糊的营销术语，有时与“虚拟个人助理”同义。一些 20 世纪的定义将主体描述为帮助用户或代表用户行事的程序。这些例子被称为软件主体（software agents），有时将“智能软件主体”（即具有智能的软件主体）称为“智能体”。

Nikola Kasabov 认为，智能体系统应具有以下特征：

逐步适应新的问题解决规则
在线和实时适应
能够根据行为、错误和成功来分析自己
通过与环境的互动学习和改进
从大量数据中快速学习
具有基于记忆的示例存储和检索能力
具有代表短期和长期记忆、年龄、遗忘等的参数。

参考文献

Niazi, Muaz; Hussain, Amir. Agent-based Computing from Multi-agent Systems to Agent-Based Models: A Visual Survey. Scientometrics. 89 (2): 479–499. (2011).

wiki: Agent

wiki: Agent(economics)

wiki: Biological agent

百度翻译: agent-based

wiki: Agent-based model

Samuelson, Douglas A. (February 2005). “Agents of Change”. OR/MS Today.

Samuelson, Douglas A.; Macal, Charles M. (August 2006). “Agent-Based Modeling Comes of Age”. OR/MS Today.

wiki: Agent-based model in biology

wiki: Agent-based computational economics

wiki: Agent-based social simulation

wiki: Intelligent agent

Russell, Stuart J.; Norvig, Peter (2003). Artificial Intelligence: A Modern Approach (2nd ed.). Upper Saddle River, New Jersey: Prentice Hall. Chapter 2. ISBN 0-13-790395-2.

Weiss, G. (2013). Multiagent systems (2nd ed.). Cambridge, MA: MIT Press. ISBN 978-0-262-01889-0.

Multi-agent system

复杂系统领域中的“agent”释义