GLUE Dataset

1. XNLI

Multi-Genre Natural Language Inference(Cross-lingual),跨语言的自然语言推断,huggingface-xnli-zh-train部分在线示例
判断premise是否被hypothesis蕴含。label:neutral, entailment蕴含,contradiction矛盾.分类任务.
训练集zh部分示例

2.QQP

Quora Question Pairs来自Quora的两个问题句子是否一致,一致标记为duplicate, 不一致:not_duplicate.判断两个句子是否意思一样。二分类任务.
huggingface-QQP-train部分在线示例
QQP

3.QNLI

Question Natural Langiage Inference判断sentence是否包含question的答案.包含:entailment。二分类任务

QNLI 在线示例

QNLI

4.SST-2

SST-2 - Stanford Sentiment Treebank Stanford情感任务,判断句子是正向还是负向的。

SST-2在线示例
SST-2

5.CoLA

CoLA - Corpus of Linguistic Acceptability 判断句子语法是否正确。正确:acceptable.
CoLA

6.STS-B

Semantic Textual Similarity Benchmark :判断两个句子语义相似度,label:0-5浮点数。本质是回归任务,可以转换为5分类任务。

STS-B

7.MRPC

Microsoft Research Paraphrase Corpus判断两个句子语义是否相等.label:equivalent相等。
MRPC

8.RTE

Recognizing Textual Entailment: RTE也是文本蕴含任务,不同MNLI的3分类,它是2分类。not_entailment/entailment。

RTE

9.WNLI

Winograd NLI文本蕴含任务,2分类。
WNLI

Guess you like

Origin blog.csdn.net/weixin_39754630/article/details/121550843