什么是游戏AI

本文首发于我的博客qianzheqi.top。

总得来说，游戏AI（Game AI）就是一种能让开发者为玩家创造引人入胜体验的东西。我们用的每一个技术、每一个技巧、每一种算法，都是为了那么一个单一的目标。本文将围绕这一点展开讲解究竟什么是游戏AI。

首先需要明白的一点是，游戏AI中的AI（Artificial Intelligence，人工智能）与我们讨论计算机视觉、自然语言处理等领域时所说的AI其实是两回事。在本文中，我们把后者称为学术AI（academic AI）。

那么学术AI和游戏AI本质的区别是什么呢？学术AI的目的是创造一个智能体，该智能体根据环境作出动作，以最大化成功率为目的。例如在图像识别任务中，我们希望AI能够获得尽量高的准确率。而游戏AI并不是要做到最大化成功率。例如在星际争霸的游戏中，我们并不是以胜利为目的来设计AI的，而是以让玩家有一段美妙的游戏体验而设计的。在这种目的的引导下，我们有时故意把AI做的不那么强大，甚至通过让AI作弊来获取更多信息。而获取这些信息不是为了击败玩家，而是为玩家提供更好的服务（关于这些，会在后文详细展开）。有时游戏AI也会借助学术AI的方法，但绝大多数时候，他们是不同的。游戏AI关注的是：AI的外在表现，以及给玩家带来的感觉。

创造体验

上文已经提到，游戏是要为玩家创造引人入胜的体验。而游戏AI是为了支撑这段体验（游戏的其他部分其实也是）。接下来要讨论的是为了支撑这段体验，设计游戏AI时，有哪些关键因素。

(1)搁置怀疑

玩家是自愿地加入到这段我们为他创造的体验中来的。因此，他们非常愿意搁置自己对我们所创造的虚假世界的怀疑。而我们的责任是维持玩家“搁置怀疑”的状态。

由于玩家自愿来享受这段体验，也因为人类大脑的工作方式，因此他们是非常宽容的。只要AI的行为基本合乎情理，玩家的大脑就会自然地向自己解释AI的行为，而那种解释往往是复杂的，比实际的AI算法复杂的多。所以，AI设计者可以尽量设计简单但合理的AI。太过于复杂的AI反而会让玩家摸不着头脑，适得其反。

有一种要避免的情况，就是人造蠢货（artificial stupidity）。所谓人造蠢货就是指做一些显然错误，或没有意义的事。确实在很多游戏中出现了这样的AI，但也不是故意的设计，而是一些BUG。比如一直朝着墙走，或完全无视玩家对他的射击。

有些行为虽然也会在真实人类身上看到，但仍然要避免，因为他们不适合AI。例如，人类总是频繁地改变自己的想法，但如果AI也这么做了，就会给玩家一种出现Bug的印象。

解决人造蠢货最简单方法就是增强AI。但是，玩家的品位各不相同，很难同时满足所有玩家。因此还诞生了一些别的方法，解决人造蠢货让玩家无法“搁置怀疑”的问题。例如，在有的僵尸游戏中，僵尸的AI被故意创造成走路缓慢、一摇一晃的样子，但由于他们是长相可怕的僵尸，仍然可以被玩家接受。还有一些游戏中，让游戏的角色喊出一些话。例如，“手榴弹（Grenade！）”，“我发现他了！”。这些并不是用作游戏角色间的交流，而是向玩家解释角色的行为。有些游戏直接在角色头顶放一些图标来向玩家解释（例如模拟人生）。

(2)反应性，不确定性和创作者控制

各种各样的结构，那个对于游戏AI来说才是最好的？这是一个被广泛讨论的问题。

首先要讨论的是，“创作者控制（Authorial Control）”和“自我控制（Autonomy）”之间的权衡。所谓“创作者控制”是指AI的创作者对AI的掌控，创作者能根据自己的意愿调整、控制AI，而AI受环境的影响较小。“自我控制“是指AI受创作者的控制力度小，根据环境的不同做出多变的反应。举例来说，Alpha Go就是高度自我控制的。因为他通过蒙特卡洛树搜索+深度强化学习训练得到，设计者也不知道最终AI下棋的模式是什么样子，可以说他几乎完全不受创作者意愿影响。下图给出了不同算法的“创作者控制”和“自我控制”比例的相对关系。

不同算法的“创作者控制”和“自我控制”比例的相对关系
“自我控制”很多时候称作强反应性（Reactivity）。反应性指的是AI能够根据环境不同做出不同行为的能力。

没有一个确定的答案说哪一种算法更好。这往往是根据需求而定的。例如策略游戏（例如魔兽争霸）就需要较强的反应性。玩家每一局的行为是不同的，AI以不变应万变显然是不合适的。而在像魔兽世界这样的游戏中，AI的行为往往是高度受“创作者控制”的。同一个副本，刷第一遍和刷第二遍，怪物的AI并不会有什么不同的行为。

选择AI结构时，另一个复杂的因素是不确定性（nondeterminism）。很多时候游戏中的随机性能够带来更多的快乐（例如Roguelike）。和反应性不同，反应性要求的是对不同环境作出不同的行为，而不确定性是指同样的情况下也能作出不同的行为。在这一点上，behavior trees 和 utility-based AI 是比较好的。

总得来说，结构是根据游戏需求选择的。

(3)简单和可扩展

如果熟悉游戏AI常用的算法，可以发现他们本身是非常简单的。而已这些算法为框架，在框架之上建立的结构才是复杂的部分。底层算法代码简洁、容易理解、容易debug，这是非常重要的。

有些算法的可扩展性很差，当AI结构越来越大，会越来越难维护。因此，一个好的游戏AI算法，不光要简单，而且要求扩展性好。

(4)技巧和作弊

首先要讲一个魔兽争霸里的剧情AI的例子。AI会等待固定的一段时间，然后产生一波兵攻击玩家。它会选择在战场迷雾的边缘产生这些单位，也就是在你的可见范围外，AI会不停的生成士兵，直到你的防御力量几乎被毁灭，然后AI就会停止，并让你用剩余的兵力赢得战斗。

在这个例子中，可以说AI是完完全全的作弊。他不需要任何建造、采集，可以任意的让单位从天而降。但他的结果是好的，他让玩家体验了一场惊心动魄的战争。

但是，这种作弊有一个弱点，它只在玩家不知情的情况下有效。如果玩家发现了AI在做什么，那么设计者精心设计的游戏体验将毫无意义。

还有一种作弊称作“完全信息”。即AI知道一切。他拥有所有的视野，不需要探索就能知道金矿的位置、敌人的位置。事实上这是必要的。因为目前AI还没有像人类一样的推理能力。例如一个单位出现在AI的视野里，然后消失了，但下一瞬间又出现了。人类能够推断这个单位就是之前小时的单位，但是这对AI来说是困难的。我们不能要求AI在玩家的电脑上存储自己的记忆。

但是，完全信息的AI仍然需要让玩家“搁置怀疑”。即使AI知道金矿的位置，也不能因此而不去探索。让AI有一定的概率去探索一个实际已知，但却不应该知道的地方。这样一来，AI的行为就能更好得被玩家的头脑所解释。

总结

游戏AI只应该关于一件事：如何让开发者为玩家创造一段引人入胜的经历。

本文是对《Game AI PRO》第一章的总结加一点个人想法。有时间会持续更新后续章节。

创造体验

(1)搁置怀疑

(2)反应性，不确定性和创作者控制

(3)简单和可扩展

(4)技巧和作弊

总结

猜你喜欢