From Sparse to Dense: GPT-4 Summarization with Chain of Density Prompting

物联网 2023-09-16 17:58:16 阅读次数: 0

本文是LLM系列的文章，针对《From Sparse to Dense: GPT-4 Summarization with Chain of Density Prompting》的翻译。

从稀疏到密集：密度链提示下的GPT-4摘要

摘要
1 引言
2 密度提升链
3 统计数据
4 结果
5 相关工作
6 结论
7 局限性

摘要

选择要包含在摘要中的“正确”信息量是一项艰巨的任务。一个好的总结应该是详细的、以实体为中心的，而不是过于密集和难以遵循。为了更好地理解这种权衡，我们寻求越来越密集的GPT-4摘要，我们称之为“密度链”（CoD）提示。具体来说，GPT-4在不增加长度的情况下迭代合并缺失的显著实体之前，生成初始实体解析摘要。与普通提示生成的GPT-4摘要相比，CoD生成的摘要更抽象，表现出更多的融合，并且具有更少的潜在偏差。我们对美国有线电视新闻网每日邮报的100篇文章进行了人类偏好研究，发现人类更喜欢GPT-4摘要，这些摘要比普通提示生成的摘要更密集，几乎和人类书面摘要一样密集。定性分析支持这样一种观点，即在信息性和可读性之间存在权衡。HuggingFace上免费提供500份注释CoD摘要，以及额外的5000份未注释摘要。

1 引言

2 密度提升链

3 统计数据

4 结果

5 相关工作

6 结论

我们研究了概括致密化对人类整体素质偏好的影响。我们发现，优选一定程度的致密化，然而，当摘要每个token包含太多实体时，很难保持可读性和一致性。我们开源了带注释的测试集以及更大的未带注释的训练集，以进一步研究固定长度、可变密度摘要的主题。

7 局限性

我们只分析单一领域的CoD，即新闻摘要。注释没有显示出高度的汇总级别一致性，但确实开始显示系统级别的趋势，这与之前基于LLM的评估工作一致。最后，GPT-4是一个闭源模型，因此我们不能共享模型权重。然而，我们确实发布了所有评估数据、注释，以及5000个未注释的CoD，用于下游用例，例如，密度蒸馏到开源模型中，如LLAMA-2。

猜你喜欢

转载自blog.csdn.net/c_cpp_csharp/article/details/132824141

From Sparse to Dense: GPT-4 Summarization with Chain of Density Prompting

Tensorflow－tf.sparse_to_dense()

tf.sparse_tensor_to_dense

Prompting Chain of Thought思维链开发实战

DSD（Dense-Sparse-Dense Training）算法详解

【TensorFlow】tf.sparse_to_dense的用法

dense向量和稀疏向量sparse

module 'tensorflow' has no attribute 'sparse_to_dense'

深度补偿模型sparse-to-dense测试

chain of thought prompting elicits reasoning in large language models

论文阅读：chain of thought Prompting elicits reasoning in large language models

华为诺亚提出新型Prompting (PHP)，GPT-4拿下最难数学推理数据集新SOTA

GPT-4拿下最难数学推理数据集新SOTA！新型Prompting让大模型推理能力狂升！

[深度学习论文笔记]3D U-Net: Learning Dense Volumetric Segmentation from Sparse Annotation 从稀疏标注学习密集体分割

2017-04-28 Saliency Detection via Dense and Sparse Reconstruction

使用tf.sparse_to_dense()时遇到的is out of order报错

韩松DSD:Dense-sparse-dense training for deep neural networks论文详解

LLMs：《Orca: Progressive Learning from Complex Explanation Traces of GPT-4》翻译与解读

（论文阅读）Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

思维链（Chain-of-Thought Prompting Elicits Reasoning in Large Language Models）

论文阅读 [TPAMI-2022] Kernel-Based Density Map Generation for Dense Object Counting

Development of Neural Network Models in Text Summarization - 4

sparse_hash_map、dense_hash_map和sparsetable的实现细节

tf.sparse_tensor_dense_matmul 和 tf.SparseTensor 实例

Python3 用类实现疏松向量（sparse vector）和稠密向量（dense vector）的运算

使用tf.tile()和tf.sparse_to_dense()构建多标签

Real-Time Open-Domain Question Answering with Dense-Sparse Phrase Index（DENSPI）

itertools.chain.from_iterable()的含义与用法

【Prompting】ChatGPT Prompt Engineering开发指南（4）

Learning by Playing – Solving Sparse Reward Tasks from Scratch

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)