A Survey of Large Language Models Attribution - 代码天地

A Survey of Large Language Models Attribution

企业开发 2024-01-08 19:03:55 阅读次数: 0

本文是LLM系列文章，针对《A Survey of Large Language Models Attribution》的翻译。

大型语言模型归因研究综述

摘要
1 引言
2 任务定义
3 归因的来源
4 归因数据集
5 归因方法
6 归因评估
7 讨论

摘要

开放域生成系统在会话人工智能领域（例如，生成搜索引擎）获得了极大的关注。本文全面回顾了这些系统所采用的归因机制，特别是大型语言模型。尽管归因或引用提高了事实性和可验证性，但模糊的知识库、固有的偏见和过度归因的缺点等问题可能会阻碍这些系统的有效性。这项调查的目的是为研究人员提供有价值的见解，帮助改进归因方法，以提高开放领域生成系统生成的响应的可靠性和准确性。我们认为，这一领域仍处于早期阶段；因此，我们维护了一个存储库来跟踪正在进行的研究https://github.com/hitsz-tmg/awesome-llm-attributions.

1 引言

2 任务定义

3 归因的来源

4 归因数据集

5 归因方法

6 归因评估

7 讨论

7.1 归因错误分析

7.2 归因的局限性

7.3 归因的挑战性

7.4 归因的未来方向

LLM的持续更新。即将到来的进步的一个有希望的方向是创建一个持续刷新LLM信息的系统，类似于搜索引擎更新数据库的方式。这种方法不仅确保了归因的最新内容，还提供了一个持续学习和适应的平台。
增强LLM输出的可靠性。另一个关键方向是提高LLM输出的可信度。这可以通过纳入严格的系统来实现，这些系统评估他们所属信息来源的可信度和准确性。确保可靠和一致的来源将增强用户对所生成内容的信心。随着LLM在各个领域的广泛采用，其输出的可靠性对于不同部门的知情决策至关重要。
平衡创造力和适当的信用归因。此外，LLM因其创造性的内容生成而受到认可。在这种创新能力和适当的信贷之间取得平衡是一项需要调查的微妙行为。虽然创造力是LLM的重要优势之一，但确保生成的内容保持可信并植根于事实基础至关重要。其目的是确保LLM在不妨碍其创作潜力的情况下承认来源。平衡这两个方面可以营造一个用户既从模型中受益又信任其输出的环境。

猜你喜欢

转载自blog.csdn.net/c_cpp_csharp/article/details/135089488

A Survey of Large Language Models Attribution

Large Language Models in Finance: A Survey

论文阅读 A Survey of Large Language Models 3

论文阅读 A Survey of Large Language Models 2

论文阅读 A Survey of Large Language Models 1

A Survey on Model Compression for Large Language Models

A Survey on Multimodal Large Language Models for Autonomous Driving

A Survey of Text Watermarking in the Era of Large Language Models

Shortcut Learning of Large Language Models in Natural Language Understanding: A Survey，2020

大模型 LLM 综述, A Survey of Large Language Models

A survey of Large Lanuage models

大型语言模型综述，非常详细，格局打开！A Survey of Large Language Models

Paper：《Instruction Tuning for Large Language Models: A Survey—大型语言模型的指令调优的综述》翻译与解读

Advancing Transformer Architecture in Long-Context Large Language Models: A Comprehensive Survey

论文解读：Siren’s Song in the AI Ocean: A Survey on Hallucination in Large Language Models

Challenges and Applications of Large Language Models

【论文精读】Emergent Abilities of Large Language Models

Are Emergent Abilities of Large Language Models a Mirage?

Enabling Large Language Models to Generate Text with Citations

Recommender Systems in the Era of Large Language Models (LLMs)

Augmented Large Language Models with Parametric Knowledge Guiding

Trends in Integration of Knowledge and Large Language Models

论文解读：Large Language Models as Analogical Reasoners

TASKBENCH: BENCHMARKING LARGE LANGUAGE MODELS FOR TASK AUTOMATION

HaluEval： A Large-Scale Hallucination Evaluation Benchmark for Large Language Models

A Survey of Graph Meets Large Language Model: Progress and Future Directions

论文阅读 | Pre-trained Models for Natural Language Processing: A Survey

Pre-trained Models for Natural Language Processing: A Survey

chain of thought prompting elicits reasoning in large language models

论文阅读：chain of thought Prompting elicits reasoning in large language models

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)