ABM_靠谱吗?以建模病毒扩散为例

建模不是做玩具,是为了回答问题。

问题可能很具体,比如,在未来一个月,某市每天需要为肺炎重症患者预留多少张床位?也可能相对模糊,比如,国内是否会出现二次爆发?

对模型的**基本要求,是其灵活性足以捕捉研究对象的核心特点,或者说,决定系统演进的核心机制。**比如,捕捉人传人的机制,得到指数增长的结果。同样的事情微分方程也能做到,但 ABM 的特点在于,它变优化为模拟,自底向上,微观着手、宏观着眼,提供了更高的灵活性以纳入更多必要的细节:

第一,人的互动在空间中并非均匀分布,它发生在网络上,一些中心节点的存在会加速病毒扩散,比如超市、教堂、学校、公共交通等。

第二,人与人是异质的。比如,年轻人活动多但抵抗力强、重症率低,老年人活动少但抵抗力差、重症率高——重症数量超过医疗系统负载后,会出现死亡率激增的拐点,因此老年人口比例是决定病毒冲击力的关键参数。此外,异质性和互动网络还可能彼此加强,比如,低收入群体防护支出少、感染概率高,而他们往往又在服务行业工作、接触人多,这更加速了扩散。

第三,人是有限理性的,会依据一定的行为规则 (behavioral rule) 对环境做出反应,包括病毒的威胁、政策的约束、他人行为的变化等,之后,群体行为的变化又会反过来作用于环境。

第四,人有记忆、会学习,因此,在更长的时间尺度看,对病毒的记忆可能让人调整自己的行为规则 (behavioral rule adjustment),并在下次遇到相似情况时表现得不同,比如对信息更警觉,反应更快、更强,对政策更配合,这在群体层面上也影响着病毒的扩散。

以上四方面对应着 ABM 的四个核心视角——主体互动、异质性、有限理性、学习与演化——它们一起支撑了 ABM 的灵活性,以捕捉主导病毒扩散的核心机制。但要回答具体问题,对模型还有着**进一步要求:把灵活性的潜力,落地为可靠性的实力。**相应的努力包括三方面:

第一,校准 (calibration),即用更贴近现实的参数设定来初始化模型。

第二,检验 (validation),即将模型输出与现实数据比较,衡量模型对系统的复现能力 [1]。

第三,敏感性分析 (sensitivity analysis),考虑到参数校准可能不够准确,要讨论当它们在一定范围内波动时,对主要结论的影响。

一个好的 ABM,要在灵活性和可靠性上找到合适的权衡,二者一起支撑也约束了模型的价值。

首先,ABM 要有自己的边界,不能滥用灵活性——超过了证据的支撑,它只能带来无意义的不确定性。

比如,在病毒扩散的 ABM 中引入主体的生产效率及其异质性,试图衡量疫情对经济活动的影响。这当然比引入主体的肤色及其异质性有价值,但生产是一个庞大的系统,如果不能有效校准,反而会影响我们对病毒扩散的观察。

其次,ABM 要找准自己的定位,在决策支持上谨慎预测、发挥长处。

所有模型都想做预测,但人毕竟不是粒子,他们组成的社会经济系统有着极高的复杂性。但另一方面,这又确实是现实迫切的需求,比如回答前面提到的问题:在未来一个月,某市每天需要为肺炎重症患者预留多少张床位?当没有其他更好的办法时,ABM 只能硬着头皮上,但根据认真校准、检验、敏感性分析得到的结论来决策,总比纯拍脑袋要好。

ABM 真正的长处,是通过其四个核心视角,来揭示、呈现系统的涌现特性,来帮助我们更好地理解、想象系统可能出现的状态。相较于预测得精准,ABM 更强调想象得更全面、呈现得更清楚,为各种政策设计提供模拟平台,为决策提供支持。比如:当互动网络存在中心节点时,会多大程度上加速病毒的扩散速度?如果无法限制集中购物、宗教活动,只约束其他出行和聚集行为,病毒扩散会得到多大程度的抑制?为了避免医疗系统超载、死亡率飙升的引爆点 (tipping point),我们需要怎样的响应速度、检测能力、隔离区容量、重症床位数量的组合?由于尚无疫苗和治疗手段,疫情是否会出现多次高峰?病毒的潜伏期长度、重复染病概率、老年人口比例等因素,又会给以上问题带来怎样的影响?面对众多因素和不确定性,ABM 可以用成千上万次模拟暴力呈现。当然,其结论的可靠性依然需要校准、检验、敏感性分析来支撑。

最后,ABM 只是众多模型的一种,需要比较各模型的结果,重视对同一系统的共同结论。

对于同一个复杂系统,各类模型的视角不同,呈现出的结论也不同。即便都是 ABM 方法,不同模型的设计不同,结论也可能不同。甚至,同一个 ABM 模型,不同的参数组合,结论依然可能不同。但是,如果把所有模型和结论放在一起,如果某些结论是大多数模型的共识,那它的可靠性就得到了多方验证,值得关注 [2]。

综上,回到本文题目的问题——ABM 靠谱吗?

这个问题不够好,更合适的问法应该是:怎么能把 ABM 用得尽可能靠谱?

它取决于三方面:第一,主导系统演进的机制,是否适于用 ABM 的四个核心视角来捕捉?第二,我们所关心的问题是否聚焦于此?第三,我手头的数据能提供怎样程度的可靠性支持?

模型就是理论,理论专注于现实也接受现实的检验。不同理论假设、推导、结论自然不同,但研究者不必妄自菲薄,实事求是、专注真问题,精进技艺、扬长避短,作为一份子,为科学共同体认识世界、影响世界做出自己的边际贡献即可。


[1] 对一部分难以直接校准的参数,有时也会把校准和检验结合起来——用模型输出和真实数据的差来驱动搜索参数空间,最终完成对模型的校准。感兴趣的朋友可以读Platt (2020) - A Comparison of Economic Agent-Based Model Calibration Methods。
[2] 类似思想也体现在对 ABM 的校准中,被称为 abduction analysis。与其他 calibration and validation 方法不同,abduction analysis不追求得到一组唯一的参数值,而只强调用实证数据尽可能地缩减参数空间。然后,在参数空间中随机抽取参数组合,带入模型,模拟结果,称每组结果来自一个model specification。如果某个结论被大部分 model specification所共享,那么就把它作为研究结论。感兴趣的朋友可以读 Werker and Brenner (2004) - Empirical Calibration of Simulation Models。

猜你喜欢

转载自blog.csdn.net/qq_45270849/article/details/130697410
今日推荐