ParaBLEU:Generative Pretraining for Paraphrase Evaluation - 代码天地

ParaBLEU:Generative Pretraining for Paraphrase Evaluation

业界资讯 2023-06-21 11:48:25 阅读次数: 0

ParaBLEU:Generative Pretraining for Paraphrase Evaluation

论文地址：[2107.08251v1] Generative Pretraining for Paraphrase Evaluation (arxiv.org)

主要内容

提出了ParaBLEU，一种使用预训练模型来评估释义的方法，我们常用评估释义（使用语义相似的seq2seq任务）有Rouge，Bleu，meteor等。

在这里插入图片描述

上图为本文模型图，左边第一个模型将ref和cand并列进行MLM任务，学习到基本的文本表示知识，中间模型则是通过ref进行分析参考文本的语法正确性，语义连贯性等内容分析，最右边的模型则是一个文本蕴含任务，也就类似ref和cand语义相似度分类任务，最后综合上面的Loss进行多任务预训练，得到的预训练模型可以很好的评估文本释义任务。

损失函数：在这里插入图片描述

评价

确实目前文本生成任务，seq2seq任务的评价指标基本都是Rouge，翻译任务还是bleu，毕竟简单方便，但目前要想翻译模型和生成模型达到更好的指标，一个更好的评价指标是必不可少的，本文使用一个预训练模型构建这个评价模型，虽然确实过于复杂和庞大，而且模型不可解释性也无法从实验结果外理论上进行证明其有效性，高效性。其实用性还有待考察，并且速度慢和使用复杂对于目前学术界和工业界都很难应用，期待未来有更好的释义生成评价指标吧。

猜你喜欢

转载自blog.csdn.net/be_humble/article/details/125029161

ParaBLEU:Generative Pretraining for Paraphrase Evaluation

<Convolutional Neural Network for Paraphrase Identification>

Evaluation Stack

PyMySQL Evaluation

干货分享：留学Paraphrase技巧盘点

paper解读：Decomposable Neural Paraphrase Generation

HUNER: improving biomedical NER with pretraining

LintCode - Expression Evaluation

BLEU:Bilingual evaluation understudy

Evaluation of Deep Learning Toolkits

Policy Evaluation.ipynb

COCO detection evaluation metric

BLEU (Bilingual Evaluation Understudy)

[WEKA] 2 evaluation

Monte Carlo Policy Evaluation

Konrad and Company Evaluation

Test command -signal Evaluation

Model Selection & Evaluation

[RxJS] defer() lazy evaluation

CONDITIONS EVALUATION REPORT

Lecture 13: Contextual Word Representations and Pretraining

XLNet: Generalized Autoregressive Pretraining for Language Understanding

BERT: Pretraining of Deep Bidirectional Transformers fo

Paraphrase-Driven Learning for Open Question Answering阅读笔记

论文阅读 | Adversarial Example Generation with Syntactically Controlled Paraphrase Networks

Dynamic Pooling and Unfolding Recursive Autoencoders for Paraphrase Detection 翻译

paper解读：Dictionary-Guided Editing Networks for Paraphrase Generation

[英语单词] password, passphrase, passport.... paraphrase

Evaluation Essay怎么写?Evaluation Essay写作技巧分析

Weka开发［3］－Evaluation类

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)