教授 LLM 思考和行动：ReAct Prompt Engineering

业界资讯 2023-06-12 08:26:13 阅读次数: 0

长话短说

普林斯顿大学教授和谷歌研究人员最近发表了一篇论文，描述了一种新颖的提示工程方法，该方法使大型语言模型（想想 ChatGPT）能够在模拟环境中进行推理和智能行动。这种 ReAct 方法模仿人类在现实世界中的运作方式，因为我们可以通过口头推理并采取行动来获取信息。ReAct 被发现在各种领域中与其他提示工程（和模仿学习）方法相比表现良好。这标志着朝着人工通用智能 (AGI) 和具身语言模型（像人类一样思考的机器人）迈出了重要一步。

背景

在本节中，我将讨论大型语言模型、提示工程和链式思维推理。

大型语言模型

大型语言模型 (LLM)是一种机器学习Transformer模型，它已经在庞大的语料库或文本数据集（例如互联网上的大多数网页）上进行了训练。在需要大量时间（和/或 GPU）、能量和水（用于冷却）的训练过程中，梯度下降用于优化模型的参数，使其能够很好地预测训练数据。本质上，LLM 学习预测给定一系列先前单词的最可能的下一个单词。这可用于执行推理——找出模型生成某些文本的可能性——或文本生成，像 ChatGPT 这样的法学硕士用来与人交谈。一旦 LLM 完成训练，它就会被冻结，这意味着它的参数被保存并且它不会向其训练数据添加输入或重新训练 - 这样做是不可行的，正如我们从微软的 Tay 聊天机器人成为纳粹分子中学到的那样，最好不要向用户学习。重要的是要注意 LLM 仍然从他们的训练数据中学习偏见，而 ChatGPT 背后的公司 OpenAI 必须增加安全措施——使用从人类反馈中强化学习 (RLHF) —— 试图防止模型生成有问题的内容。此外，由于默认情况下 LLM 只是根据他们所看到的内容生成最有可能的下

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/131152410

教授 LLM 思考和行动：ReAct Prompt Engineering

LLM提示词工程和提示词工程师Prompting and prompt engineering

【ChatGPT】Prompt Engineering入门

Prompt Engineering for Developer

【Prompt Engineering 教程：写 Prompt 的艺术】1、什么是 Prompt Engineering？

技术 | 提示工程—Prompt Engineering

Prompt Engineering 面面观

解读提示工程（Prompt Engineering）

LLM：prompt指令数据制作

LLM prompt提示构造案例

LangChain Prompt Engineering和LLMs：如何让语言模型更好地理解和生成文本

面向普通用户和开发者的ChatGPT Prompt Engineering 终极指南

Openai+Coursera: ChatGPT Prompt Engineering(一)

Openai+Coursera: ChatGPT Prompt Engineering(三)

Text-to-SQL提示工程【Prompt Engineering】

Openai+Coursera: ChatGPT Prompt Engineering(二)

Openai+Coursera: ChatGPT Prompt Engineering(四)

吴恩达ChatGPT《Prompt Engineering》笔记

使用 Prompt Engineering 提升你的 GPT

AI Prompt Engineering 提示工程推荐

大语言模型的预训练[3]之Prompt Learning：Prompt Engineering、Answer engineering、Multi-prompt learning详情

九类AI应用和五个简单LLM的Prompt技巧

Prompt工程师指南[应用篇]：Prompt应用、ChatGPT|Midjouney Prompt Engineering

LLM 系列 | 05：ChatGPT Prompt的迭代优化

LLM 系列 | 04：ChatGPT Prompt编写指南

LLM(1)之基础使用prompt

【LLM】Prompt tuning大模型微调实战

LLM Prompt Technique 论文精读-2

LLM Prompt Technique 论文精读-1

ChatGPT写文章加引用提示词prompt engineering

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)