Exploring the Intersection of Large Language Models and Agent-Based Modeling via Prompt Engineering

物联网 2023-08-22 17:54:48 阅读次数: 0

本文是LLM系列文章，针对《Exploring the Intersection of Large Language Models and Agent-Based Modeling via Prompt Engineering》的翻译。

通过提示工程探索大型语言模型与基于Agent的建模的交叉点

摘要
1 引言
2 方法
3 结果
4 相关工作
5 结论

摘要

模拟的最终边界是精确表示复杂的、真实世界的社会系统。虽然基于代理的建模（ABM）试图研究更大系统中代理的行为和交互，但它无法忠实地捕捉人类驱动行为的全部复杂性。像ChatGPT这样的大型语言模型（LLM）已经成为解决这一瓶颈的潜在方案，使研究人员能够以以前难以想象的方式探索人类驱动的交互。我们的研究调查了使用LLM模拟人类互动的情况。受Park等人的启发，通过提示工程，我们提出了两种人类行为可信代理的模拟：两名特工的谈判和六名特工的谋杀推理游戏。

1 引言

2 方法

3 结果

4 相关工作

5 结论

尽管模拟还很初级，但这项研究强调了建立大规模数字游乐场的潜力，以使用LLM评估现实世界中人类驱动的行为。关于可信度，Park等人量化了LLM驱动模拟的可信度，并发现LLM代理可以产生比人类状况更可信的行为，正如众包人类评估人员所评估的那样。
最后，我们强调了制作大规模LLM模拟的两个挑战。

gpt-3.5-turbo的4096个最大提示token限制限制了我们模拟的复杂性。更大的上下文窗口可能实现涉及数千个LLM代理的大规模模拟和跨越多年模拟时间的长期模拟。
从大型上下文窗口中检索相关信息仍然是一项复杂的任务。可能的解决方案可能涉及启发式、会话历史的总结，或者结合注意力机制来关注记忆流。

猜你喜欢

转载自blog.csdn.net/c_cpp_csharp/article/details/132426680

Exploring the Intersection of Large Language Models and Agent-Based Modeling via Prompt Engineering

【人工智能】大模型提示工程的完整介绍 | A Complete Introduction to Prompt Engineering For Large Language Models

Exploring the Potential of Large Language Models (LLMs) in Learning on Graphs

MASSIVE EDITING FOR LARGE LANGUAGE MODELS VIA META LEARNING

【论文精读】GPT-NER: Named Entity Recognition via Large Language Models

Challenges and Applications of Large Language Models

A Survey of Large Language Models Attribution

Large Language Models in Finance: A Survey

Learning to Prompt for Vision-Language Models

【论文精读】Emergent Abilities of Large Language Models

论文阅读 A Survey of Large Language Models 3

Are Emergent Abilities of Large Language Models a Mirage?

论文阅读 A Survey of Large Language Models 2

论文阅读 A Survey of Large Language Models 1

Enabling Large Language Models to Generate Text with Citations

Recommender Systems in the Era of Large Language Models (LLMs)

A Survey on Model Compression for Large Language Models

Augmented Large Language Models with Parametric Knowledge Guiding

论文解读：Large Language Models as Analogical Reasoners

TASKBENCH: BENCHMARKING LARGE LANGUAGE MODELS FOR TASK AUTOMATION

A Survey on Multimodal Large Language Models for Autonomous Driving

Trends in Integration of Knowledge and Large Language Models

A Survey of Text Watermarking in the Era of Large Language Models

【笔记】Prompting Large Language Models with Answer Heuristics forKnowledge-based VQA

HaluEval： A Large-Scale Hallucination Evaluation Benchmark for Large Language Models

Shortcut Learning of Large Language Models in Natural Language Understanding: A Survey，2020

Language Modeling

【微调视觉-语言模型】Learning to Prompt for Vision-Language Models

Paper Reading：《LISA: Reasoning Segmentation via Large Language Model》

【复杂网络建模】——基于代理的社会网络建模（Agent-Based Modeling，ABM）[Python实现]

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)