ICLR‘24 大语言模型智能体最新研究进展丨智能体应用篇

在大语言模型驱动下的自主智能体方面，作者所在团队发布了该领域的早期综述（见A Survey on LLM-based Autonomous Agents），并构建了用户行为分析领域中首个基于自主智能体的模拟环境RecAgent（见RUC-GSAI/YuLan-Rec），欢迎大家关注。

基于大语言模型的智能体(LLM-based Agent)在近期得到了广泛关注。本文汇总了在ICLR’24提交的论文中，基于大语言模型的智能体相关的全部论文，并进行了分类汇总，共计98篇。

Survey: https://github.com/Paitesanshi/LLM-Agent-Survey
Code: https://github.com/RUC-GSAI/YuLan-Rec

今天我们给大家分享的是「智能体应用」主题的论文，共25篇。

内容转载自公众号RUC AI Box：

ICLR’24 大语言模型智能体最新研究进展丨智能体能力篇

1. A Language-Agent Approach to Formal Theorem-Proving

本文提出了一种基于语言的智能体COPRA，在形式化的定理证明中表现优异。

在这里插入图片描述

链接：https://www.aminer.cn/pub/652379b2939a5f4082e1b206/?f=cs

2. ToRA: A Tool-Integrated Reasoning Agent for Mathematical Problem Solving

本文提出了一系列工具集成的推理智能体，无缝集成自然语言推理与外部工具调用，用于解决复杂数学问题。

在这里插入图片描述

链接：https://www.aminer.cn/pub/651a282d3fda6d7f0600a340/?f=cs

3. Modeling Complex Mathematical Reasoning via Large Language Model based MathAgent

本文通过对数学推理过程进行细致分解和建模，探索使用agent增强LLM的潜力。

在这里插入图片描述

4. Suspicion-Agent: Playing Imperfect Information Games with Theory of Mind Aware GPT-4

本文探讨了GPT-4的学习知识在不完全信息博弈中的适用性，并提出了suspicion-agent，它基于GPT-4实现了不完全信息博弈智能体。

在这里插入图片描述

5. Large Language Models Can Design Game-Theoretic Objectives for Multi-Agent Planning

本文提出了一种基于LLM的博弈形式设计，来解决目标表示(objective representation)和多智能体行为对齐的问题。

在这里插入图片描述

6. Playing repeated games with Large Language Models

本文提出用行为博弈理论来研究LLM的合作与协调行为。

在这里插入图片描述

链接：https://www.aminer.cn/pub/64741c33d68f896efaa7b6aa/?f=cs

7. Lemur: Harmonizing Natural Language and Code for Language Agents

提出了Lemur和Lemur-Chat两种开放访问的LLM，对语言和编码能力进行了优化。

在这里插入图片描述

链接：https://www.aminer.cn/pub/6526243b939a5f4082bc4f09/?f=cs

8. Compositional Instruction Following with Language Models and Reinforcement Learning

本文提出利用使用组合值函数和LLM提升模型在服从语言指令任务的表现。

在这里插入图片描述

9. A Real-World WebAgent with Planning, Long Context Understanding, and Program Synthesis

本文提出了WebAgent，通过学习自身经验，按照自然语言指令在真实网站上完成任务。

在这里插入图片描述

链接：https://www.aminer.cn/pub/64bf49013fda6d7f06275319/?f=cs

10. 3D-GPT: Procedural 3D Modeling with Large Language Models

本文提出了一个基于LLM的指令驱动的3D建模框架。

在这里插入图片描述

链接：https://www.aminer.cn/pub/6531e2ca939a5f4082f5d67a/?f=cs

11. LLaVA-Plus: Learning to Use Tools for Creating Multimodal Agents

本文提出了Llava-Plus，一个系统性扩展LMM(Large Multimodel Model)的端到端的训练方法。

在这里插入图片描述

12. NExT-GPT: Any-to-Any Multimodal LLM

本文利用LLM与多模态适配器构建了一个多模态agent，NExT-GPT，并提出了一个轻量化的多模态对齐方法。

在这里插入图片描述

链接：https://www.aminer.cn/pub/64ffcc023fda6d7f06d03cca/?f=cs

13. Towards human-like spoken dialogue generation between AI agents from written dialogue

从书面对话中生成类似人类的口语对话仍然具有挑战性，本文提出了CHATS模型，一种基于token的源于书面对话的口语对话生成系统。

在这里插入图片描述

链接：https://www.aminer.cn/pub/651b7d6a3fda6d7f062fb53b/?f=cs

14. Optimizing Interpersonal Communication by Simulating Audiences with Large Language Models

本文探讨了如何利用LLM辅助人类沟通。

在这里插入图片描述

15. Theory-of-Mind Enhanced Dialogue Generation in Situated Contexts

本文提出了一个新的agent对话框架MindDial，集成了对话生成、计划和思维预测。

在这里插入图片描述

16. Maximizing LLMs Potential: Enhancing Mongolian Chinese Machine Translation with RL Agents and Adversarial Multi Knowledge Distillation

利用RL agent将LLM中的知识蒸馏到翻译模型中，从而显著提升蒙汉翻译质量。

在这里插入图片描述

17. Rethinking the Buyer’s Inspection Paradox in Information Markets with Language Agents

本文模拟了数字市场，探索了买方检验悖论(buyer’s inspection paradox)，强调当智能体在购买之前临时访问信息会提高决策和回答质量。

在这里插入图片描述

18. WebArena: A Realistic Web Environment for Building Autonomous Agents

本文构建了一个高度真实和可复制的，面向LLM-based agent的环境。

在这里插入图片描述

链接：https://www.aminer.cn/pub/64c1ec613fda6d7f0639738b/?f=cs

19. Lyfe Agents: generative agents for low-cost real-time social interactions

本文提出了Lyfe Agents，在LLM-based agent的社会模拟中，降低资源成本并实现实时响应，同时保持智能和目标导向。

在这里插入图片描述

链接：https://www.aminer.cn/pub/651ccb383fda6d7f0663554a/?f=cs

20. SocioDojo: Building Lifelong Analytical Agents with Real-world Text and Time Series

本文提出了SocioDojo，一个开放式的终身学习环境，用于开发随时可部署的自主智能体，能够在经济、金融、政治和文化等社会主题上执行类似人类的分析和决策。

在这里插入图片描述

21. SOTOPIA: Interactive Evaluation for Social Intelligence in Language Agents

本文提出了SOTOPIA，一个开放式的环境，用于模拟人工智能体之间复杂的社会互动，并评估其社会智能。

在这里插入图片描述

链接：https://www.aminer.cn/pub/65309159939a5f4082843dba/?f=cs

22. Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View

本文探索了LLM-based multi-agent社会中，这些NLP系统能否反映出人类的协作智能。

在这里插入图片描述

链接：https://www.aminer.cn/pub/651ccb383fda6d7f0663551a/?f=cs

23. OceanGPT: A Large Language Model for Ocean Science Tasks

本文构造了海洋科学领域大模型OceanGPT；提出了DoInstruct，通过多智能体协作自动生成海洋科学细分领域的数据；此外，本文还贡献了一个海洋科学领域数据集OCEANBENCH。

在这里插入图片描述

链接：https://www.aminer.cn/pub/651ccb383fda6d7f066354b8/?f=cs

24. Efficient Human-AI Coordination via Preparatory Language-based Convention

本文提出使用LLM来设计一个动作规划(公约)，使其能够在人机协同中有效地指导人类和AI。

在这里插入图片描述

25. PLAN-SEQ-LEARN: LANGUAGE MODEL GUIDED RL FOR SOLVING LONG HORIZON ROBOTICS TASKS

本文提出PSL（Plan-Seq-Learn），利用LLM-based agent的规划推理能力，在线高效解决机器人长跨度控制问题。

在这里插入图片描述

ICLR‘24 大语言模型智能体最新研究进展丨智能体应用篇

猜你喜欢