大模型AI：城市规划新的技术转换点

引言

城市规划作为一项事业长期以来处在这样一种矛盾的境地：一方面干预的对象几乎是世界上最复杂的系统——城市系统；而另一方面城市规划和公共政策的强绑定属性，以及处在技术应用下游的定位使得行业并不对技术敏感，这就导致从业者往往采用传统的方法来解决大多数问题。

其实业界和学界并不乏新技术的探索者，但长久以来的现实发展表明以往诸多技术可能都不是具有颠覆性的，而如今我们或许等到了一个新的转换点，那就是现在发展如火如荼的大模型AI。

大模型AI的发展

从2022年下半年到2023年初这不到一年的时间无疑是人工智能技术狂飙突进的阶段，并且在可见的时间范围里这一轮技术突破还在继续。若要为这一段传奇般的时间冠以某种美称，那么相比“AIGC元年”，“AGI元年”这样的称呼笔者更偏好称其为“大模型元年”。

笔者认为现在的技术表现出的生成应用和如同通用人工智能的能力都归因于大模型技术，而现如今表现最为突出的大模型技术则集中在图像和自然语言领域。ChatGPT, Bard, Midjourney, StableDiffusion……这些一年前还不见踪影的产品如今已被相当一部分人所熟知。

大模型技术的突破最根本源于训练数据量级的提升以及由此带来的一系列涌现能力，这让它能做到许多在训练集不够大的模型中难以想象的事情，简单地看GPT模型从初代到如今第四代的进化路径就能领略一二。但是道路并不会一直这样延伸下去，受制于可获得的数据上线以及如今的算力天花板，大模型的规模已经逐渐见顶，OpenAI的CEO Sam Altman在一次采访中说OpenAI不再专注于提升模型规模而是让现有的模型（GPT-4）表现得更好。但尽管如此也只是大模型技术在最底层的开发环节的发展将放缓，而其下游的产品化才刚刚迎来一场巨大繁盛的前夜。

这一段时间的大模型技术突破改变了我们对一般技术突破的预期，其近乎破坏性的发展在后续的相当长的时间会带来漫长的“后遗症”，产业和产品端并不能这么快很好地应用这些技术，连最“近水楼台先得月”的微软也才刚刚把AI技术部署到自己的产品中。所以我们站在这个过程点中来审视这一段发展历程时要保持对时间的敏感性，由于各种综合的原因，这一轮技术浪潮来得比大家想得都要迅速。

大模型AI的影响

关键技术门槛的普遍降低

从现阶段出现的一些尝试和思路上看，大模型带来的是以往需要一定技能门槛的知识型工作可以被较好地替代。在OpenAI最新公开的预印本论文《GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models》中研究了GPT对于现存的职业工作的影响程度，表明80%的职业将受到10%以上的影响（具体指这些职业中10%以上的工作环节可以被GPT所胜任），而19%的职业将受到50%以上的影响。这其中高门槛，高收入的职业受到的影响更大（传统的知识密集型职业），另外对于编程、写作、新闻传媒、数据分析、信息处理等职业的影响将达到极高的水平（接近100%）。

需要注意的是专业写作、编程、数据分析此类技术实际上在以往的职业生态中都是相当关键的技术，如在城市规划从业人员的招聘中如果在这些领域中有独特的专长一定会受到更多青睐，是因为一方面这些技术相对而言是较难掌握的，同时掌握了之后带来的效益是巨大的。而现在的大模型能让我们以几乎零成本掌握这些能力。这让我想到计算机技术的每一次突破都作为一个抽象层级，类似一个黑箱，后续的人就可以在不了解上一次层级的技术细节的前提下使用和研发。实际上近百年来我们的很多科技树发展都依赖于这样的“抽象阶梯”，尽管我们并非研究尖端技术的科学家，但作为普通人现在也能将前述的一系列技术作为上一层级的抽象来使用，此前这些技术从未如此平易近人。自此之后编程这类技术不再是普通人畏惧的门槛，但这个技术门槛依然会存在，它会继续上移，今后的关键技术或许会变成研究与训练AI模型的技术。

工具创造和使用的边界模糊

大模型让普通人能掌握到编程这类以往工作环节中用来“造轮子”的关键技术，那就意味着普通人能以很低的技术学习成本成为一名产品的开发者。ChatGPT在公开自己的插件商店时进行了一个插件开发的演示，全程通过和GPT沟通自己的需求，然后让GPT自己编写代码，debug，最终完成插件——这近乎实现了这个阶段最理想的无代码开发的形态。

今后工具的创造和使用的边界将变得模糊，以往对非计算机相关专业的人来说基本上只能使用被别人设计好的软件，我们需要去适应各类软件的操作逻辑和使用习惯。但是今后作为一个个体也可以日常性地进行工具开发，以满足自己的不同需求，这种红利之前几乎只在很小的一部分人当中存在。而由此会带来的是我们不再受制于既有的软件工具要求我们所使用的工作流程，而可以根据自己的偏好和业务需求进行更底层的定制化。

对创新能力的重估

另一方面的影响则更具有破坏性，大模型涌现出来的能力一定程度上已经可以取代以往我们认为的“创新型”工作，我们原本希望AI替代枯燥无味的重复性工作，但是最先受到冲击的反而是以往认为偏“知识型”和“灵感型”的工作。

由于语言概念本身的模糊性，我们在很多情景下使用不同的概念其实并不完全清楚其内涵与外延。比如“创新”这样一个概念，如果按朴素的理解为创造新东西，那么很显然现在的人工智能技术已经可以做到。所以对于今后最大的挑战在于区分AI可以带来的“创新”以及“更高层次的创新”，并且着力培养“更高层次的创新”能力。最近在很多地方看到关于人工智能在职业、教育等方面所带来的冲击的观点，大多数依然在谈论创新而不细下分辨的程度，这样无异于掩耳盗铃。很显然，只要“创新”就是价值的时代已经逐渐落幕，接下来相当长时间里我们需要对创新这类高阶能力进行重估。

大模型AI如何带来规划的变革

有助于专业领域的知识建构

城市系统不仅有极高的信息复杂度，在其底层的知识体系上也是如此。城市的相关问题往往涉及到多个专业领域，包括交通、土木、建筑、市政等工程方向，也包括经济、社会、公共政策等社会科学方向，城市规划专业人员虽然并不具体地解决某个专业领域中的问题，在日常的工作过程中也不可避免地会需要到其他各个专业的知识背景以方便开展决策思考。其次，在具体的问题解决过程中除了本身会出现在专业文献中的书面知识之外，其实也常常涉及到由经验带来的默会知识，这些知识并没有统一的客观表述或者恒定的标准，但是在长久以来的实践中被当作经验标尺来使用。

大模型在面世之初就被使用者天然地作为问答机器人来使用，而随着后续相关模型持续开源，在可见的未来我们应该能较为轻松地将大语言模型部署在个人电脑上，而基于此又会衍生出新一轮微调模型的开源生态。对规划行业而言极为重要的两个利好在于，一方面技术开源降低了技术利用的门槛和成本对于偏下游的应用行业来说十分重要，另一方面私有化部署的可能性一定程度上解决了大语言模型的安全问题，这对于经常会涉及到保密资料的行业来说有决定性的意义。这两个利好几乎确定了这个技术方向对于专业领域的知识库建构的重要性。

由于城市规划专业相关知识并不如医学这类循证体系成熟同时注重科学和实践的学科更具结构性，我们或许能够利用大语言模型来自主地学习信息间的潜在关系，以获得一个实用导向的知识库。当然在此过程中依然需要专家系统对信息的准确性进行核实，同时警惕现阶段AI对事实性问题回答的过程中可能产生的知识幻觉问题。

有助于更好地面对复杂性

前面提到城市系统由于其涉及的研究对象繁多，且相互之间的关系复杂，如何认知与分析城市一直以来都是城市研究相关学科的重心。随着前一轮机器学习技术的爆发和各种类型的大数据的出现，近年来其实也出现相当多的技术用来对城市进行分析，但是离在实践过程中有效地使用还有一定的距离。

主要存在几个原因：第一，城市分为不同的系统，其数据来源和分析的技术各不相同，如交通、生态、市政等专业往往都掌握不同的技术手段，彼此间存在门槛；第二，即便开展了某些专项的分析也仅仅是某个截面，在不同的外部条件下其揭示的规律可能存在变化，其对规划决策的影响在哪往往并不明确，最后落回到用来辅助支撑规划思路的境地；第三，城市的数据到如今还算是一种稀缺资源，并非所有地方和类别的数据都是易得的。

为了解决以上几个问题，让城市数据赋能城市规划和管理，从前几年开始各地已经相继地开展了数字化政务或者智慧城市相关的业务。通过搭建平台整合数据资源和算法开展一体化的智慧决策，但在实际落地过程中对数据的处理依然存在各种各样的问题，海量实时的数据如何快速转化为数据洞见和决策思路成为这套技术体系的痛点。

智慧城市产品脉策科技

大模型AI由于掌握了良好的数据分析能力为我们提供了这样一种思路，通过将一些典型的技术分析流程教给AI，它就可以对实时生成的大数据进行初步的分析。并且由于其采用自然语言比之前采用的图形界面更加易于交互，使用者可以很好地通过提出问题等交互过程得到自己想要的数据分析结果。当然这内里的技术实现也是相当复杂的，前段时间出现的以AutoGPT为代表的代理LLM产品思路展示了更为强大的项目自动化能力，通过将问题拆解后交给不同的代理进行处理可以实现解决模糊问题的能力。尽管近期看来其成本过高同时效果往往并不理想，但是当今后运算成本降低并且能针对特定领域进行定制化开发代理模型。

多模态是突破设计智能的一个方向

设计在实际业务中依然是规划行业十分重要的领域，而且往往起到连接用地功能和具体项目设计之间的桥梁作用，在这样的设计情境中设计不仅仅是设计师主观判断和审美意趣的表达，更是综合各种规则条件下的理性推导。以往有相当多的尝试希望提炼城市规划和设计的规则以达到智能设计的目的，但大都难以获得较好的效果。

这些尝试大多采取两类思路，一类是规则式的生成，一类是数据驱动式的生成。规则式的生成是通过人工编写规则来达到设计随输入条件自适应变化的目的，其思路是来源于建筑的参数化设计，但是这类程序在复杂性较低的场景下比较稳定，如建筑平面设计、小区设计等，而复杂性高的场景则很难达到理想的效果，其主要原因在于要人工梳理出这些潜在的规则并结构化是十分巨量的工作，而把这些海量的规则编进一套自洽的程序中也是十分困难的。而另一类采用数据驱动的方式往往利用上一轮机器学习浪潮中十分出名的生成对抗网络模型（GAN），通过输入大量的数据（多是图像）进行学习而得到一个能自动生成设计的模型，不过这类模型的缺陷在于学到的东西往往徒有其表，仅有形式变化而无内在规律，在复杂场景中几乎失去解释性。

诺亚参数规则式设计生成产品

十方DEEPUD 数据驱动的设计生成产品

大模型除了本身数据量大以外，多模态也是其重要的发展方向。由于在自然语言上获得了极高的理解能力，大模型就有机会以语言模型为中心关联多种模态的数据（如图像、声音等），比如最近Meta推出的ImageBind模型就支持图像、视频、音频、文本、深度、热量和惯性测量单元（IMUs）六种模态。在能同时学习多种模态数据的情况下模型将有机会学习到设计背后的规律并与从海量专业文本中提取出来的潜在规则相关联，那么实现更聪明的自动化设计将会变得可能。

ImageBind：Meta推出的多模态大模型

为业务流程创新带来了可能性

除了以上几个和具体技术环节关联比较紧密的变化之外，大模型AI可能造成的更大的影响在于对行业本身的业务流程的革新。尽管大模型AI现在看来在很多实践方向上还停留在个人效率提升上面，但是某些环节的效率提升到一定程度也将带来流程的变化。比如当方案生成和表现的速度足够快就有条件支持实时反馈的沟通流程，更加提高了与各方交流的效率；而对城市大数据的实时监测和分析结论沉淀最终能够实现，能够支持决策者评估城市运行的基本情况和主要问题，那么反馈式规划也将成为可能。

CityScope：MIT对于反馈式城市规划的一种尝试

我们需要作何准备

那么面对即将来临的技术转换我们需要作何准备？这里笔者给出一些个人的想法：

个人层面上，首先需要主动地去适应AI带来的交互方式的转换，以后的各种产品和工具将更倾向与直接用自然语言和AI交互，这不同于我们以往使用图形界面的交互逻辑，也和我们日常与人交流不太相同，所以需要以开放的心态多做尝试；第二需要更多地掌握元知识而非知识本身，由于大模型的赋能，以后建构“第二大脑”或者“个人知识库”将极为容易，不过为了能用好它，个人也需要掌握提问的能力，解决问题的框架以及各领域知识的基本结构，这些知识能让个人成为更会使用AI的人；第三积极地成为工具的创造者，当不囿于自己所使用工具的局限时解决问题的逻辑和思路也将充分扩展。

在机构和企业层面上，第一需要积极推进行业内AI基础设施的开发和专业数据的收集和保护，尽管大模型部署的成本将会降低但是专业化训练可能依然会是一个较大的投入，通过一定层面的合作能更好地降低边际成本；第二需要重视相关的职业化教育，对于AI的适应并没有在现有的教育体系下体现出来，所以职业阶段的培训和教育是更快让相关技术在行业内普及的路径；第三点是重视业务创新流程，提高流程运转效率。

结语

自现代科学技术突飞猛进地发展以来，几乎每一项重大的技术突破都会对城市系统造成影响。如近年来的移动互联网浪潮下的各种商业模式几乎重塑了城市中个体的行为规律和功能空间的价值规律。然而这些关键的技术突破中能为城市研究和城市规划带来提升的技术却寥寥无几，这就导致城市正在飞速地变化而从业人员却没有相适应的技术来应对的尴尬境地。大模型AI所带来的生产力变革是重点发生在工作效率层面的，这会给予从业人员更强地处理复杂问题的能力，这或许是改变这一局面的关键。

大模型AI：城市规划新的技术转换点

猜你喜欢