WaterBench: Towards Holistic Evaluation of Watermarks for Large Language Models - 代码天地

WaterBench: Towards Holistic Evaluation of Watermarks for Large Language Models

企业开发 2024-01-08 19:03:10 阅读次数: 0

本文是LLM系列文章，针对《WaterBench: Towards Holistic Evaluation of Watermarks for Large Language Models》的翻译。

WaterBench:面向大型语言模型水印的整体评估

摘要
1 引言
2 相关工作
3 WaterBench
4 实验
5 结论

摘要

为了减少对大型语言模型（LLM）的潜在滥用，最近的研究开发了水印算法，该算法限制了生成过程，为水印检测留下不可见的痕迹。由于任务的两阶段性质，大多数研究分别评估生成和检测，从而对公正、彻底和适用的评估提出了挑战。在本文中，我们介绍了第一个LLM水印的综合基准WaterBench，其中我们设计了三个关键因素：（1）对于基准程序，为了确保苹果对苹果的比较，我们首先调整每种水印方法的超参数以达到相同的水印强度，然后联合评估它们的生成和检测性能。（2）对于任务选择，我们将输入和输出长度多样化，形成一个五类分类法，涵盖9个任务。（3）对于评估指标，我们采用GPT4 Judge来自动评估水印后指令跟随能力的下降。我们在2种水印强度下对2种LLM上的4种开源水印进行了评估，并观察了当前方法在保持生成质量方面的常见困难。代码和数据在https://github.com/thu-keg/waterbench可用.

1 引言

2 相关工作

3 WaterBench

4 实验

5 结论

在本文中，我们提出了WaterBench，这是一种评估大型语言模型水印的新基准。WaterBench旨在促进对水印检测和生成质量的公平和全面评估。我们首先介绍了一种基准测试程序，该程序搜索超参数，以统一不同方法的水印强度，从而进行苹果对苹果的比较。其次，我们构建了一个多任务基准，该基准跨越了九个具有不同输入/输出长度的典型NLP任务。最后，我们结合了GPT4 Judge度量来自动评估WaterBench结果。实验表明，它能灵敏地反映水印后指令跟随质量的下降。关键发现包括短任务的难度以及不同强度下水印性能之间的差异。我们所有的代码和数据都是开源的。我们希望我们的工作能对LLM水印的未来研究起到启发和促进作用。

猜你喜欢

转载自blog.csdn.net/c_cpp_csharp/article/details/135114380

WaterBench: Towards Holistic Evaluation of Watermarks for Large Language Models

论文分享丨Holistic Evaluation of Language Models

HaluEval： A Large-Scale Hallucination Evaluation Benchmark for Large Language Models

MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models

robust distortion-free watermarks for language models

Challenges and Applications of Large Language Models

A Survey of Large Language Models Attribution

Large Language Models in Finance: A Survey

【论文精读】Emergent Abilities of Large Language Models

Are Emergent Abilities of Large Language Models a Mirage?

论文阅读 A Survey of Large Language Models 3

论文阅读 A Survey of Large Language Models 2

论文阅读 A Survey of Large Language Models 1

Enabling Large Language Models to Generate Text with Citations

A Survey on Model Compression for Large Language Models

Recommender Systems in the Era of Large Language Models (LLMs)

Augmented Large Language Models with Parametric Knowledge Guiding

A Survey on Multimodal Large Language Models for Autonomous Driving

Trends in Integration of Knowledge and Large Language Models

论文解读：Large Language Models as Analogical Reasoners

TASKBENCH: BENCHMARKING LARGE LANGUAGE MODELS FOR TASK AUTOMATION

A Survey of Text Watermarking in the Era of Large Language Models

Shortcut Learning of Large Language Models in Natural Language Understanding: A Survey，2020

【ICLR 2022】Towards Continual Knowledge Learning of Language Models

chain of thought prompting elicits reasoning in large language models

论文阅读：chain of thought Prompting elicits reasoning in large language models

大模型 LLM 综述, A Survey of Large Language Models

LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS

WizardKM:Empowering Large Language Models to Follow Complex Instructions

Tree of Thoughts: Deliberate Problem Solving with Large Language Models

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)