Shepherd: A Critic for Language Model Generation

物联网 2023-08-22 17:55:48 阅读次数: 0

本文是LLM系列的相关文章，针对《Shepherd: A Critic for Language Model Generation》的翻译。

Shepherd：语言模型生成的评价

摘要
1 引言
2 数据收集
3 Shepherd模型
4 评估反馈
5 结果
6 相关工作
7 结论
不足

摘要

随着大型语言模型的改进，人们对利用这些模型的能力来完善其自身输出的技术越来越感兴趣。在这项工作中，我们介绍了Shepherd，这是一个专门针对批评模型响应和建议改进的语言模型，它超越了未经编辑的模型的能力，可以识别各种错误并提供补救建议。我们方法的核心是一个高质量的反馈数据集，我们根据社区反馈和人类注释对其进行策划。尽管Shepherd很小（7B参数），但它的批评与包括ChatGPT在内的已建立模型的批评是等效的或首选的。使用GPT4进行评估，与竞争对手相比，Shepherd的平均胜率为53-87%。在人类评估中，Shepherd严格优于其他模型，平均而言与ChatGPT密切相关。

1 引言

2 数据收集

3 Shepherd模型

4 评估反馈

5 结果

6 相关工作

7 结论

我们引入了一个新的模型来批评大型语言模型的生成。通过在多个数据集和不同的评估设置上进行广泛的实验，我们证明了我们的模型可以有效地评判答案，达到与ChatGPT相当的性能。随着LLM在越来越多的现实应用中被采用，我们认为开发自动机制来检查模型生成是很重要的。我们的批判模型Shepherd可以非常有助于提高生成质量和减少幻觉。

不足

在本文中，我们通过自动评估和人的评估来评估模型的批判能力。尽管我们努力尝试大量的数据示例，并尽我们最大的财力使用人工注释器，但很明显，该论文可以从进一步的增强中受益。这可以通过执行更细致的分析来实现，该分析使用了更多的注释器和更广泛的各种任务。

猜你喜欢

转载自blog.csdn.net/c_cpp_csharp/article/details/132407672

Shepherd: A Critic for Language Model Generation

论文阅读：CTRL: A CONDITIONAL TRANSFORMER LANGUAGE MODEL FOR CONTROLLABLE GENERATION

论文阅读总结：UniLM(Unified Language Model Pre-training for Natural Language Understanding and Generation)

Language Model

Lecture 15: Natural Language Generation

什么是Natural Language Generation(NLG)？

Controllable Text Generation with Language Constraints

language model and RNN

RNN Language Model 详解

【深度学习】：Language Model

Neural Network Language Model

【NLP】3 Language Model

A Neural Probabilistic Language Model

语言模型（language model）

Lecture 10 Natural Language Generation（NLG）

Grounding Language Models to Images for Multimodal Generation

AudioLM: a Language Modeling Approach to Audio Generation

NLP、language model、lstm、attention model

n-gram language model

22 language model学习笔记

permutation-based language model

Tips for Generation in Encoder-Decoder model

layoutdm:discrete diffusion model for controllable layout generation

Object constraint language for code generation from activity models

Topic-Aware Neural Keyphrase Generation for Social Media Language

【论文笔记】Controllable Natural Language Generation with Contrastive Prefixes

Natural Language Generation using Transformers and Seq2

A Neural Probabilistic Language Model ------阅读笔记

Dinosaurus Island Character level language model final

NLP中的语言模型(language model)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)