XNLI: 自然言語推論
LCQMC: 意味的類似性タスク。2 つの文を入力し、2 つの文が類似しているかどうかを出力します。
LCQMC データセット形式:
MSRA-NER: 中国の固有表現の認識
ChnSentiCorp: 中国人感情分析
Nlpcc-dbqa: 検索質問応答照合タスク
SQuAD (Standford Question Answering Dataset) タスク: 質問と回答の照合タスク
MNLI (Multi-Genre Natural Language Inference): 文章が類似しているか、矛盾しているか、無関係であるかを判断します
QNLI: 質問応答 NLI: 自然言語推論、以前は SQuAD 1.0
QQP (Quora 質問ペア): 2 つの Quora 質問が同等かどうかを判断します
RTE (テキスト含意の認識): MNLI に似ていますが、データ量が少なくなります。
QNLI (質問自然言語推論): QA のペアが対応するかどうかを判断します。
SST-2 (スタンフォードセンチメントツリーバンク): センチメント分類
CoLA (Corpus of Linguistic Acceptability): 英文が文法的に正しいかどうかを判断する
MRPC (Microsoft Research Paraphrase Corpus): 2 つのコメントのセマンティクスが同じかどうかを判断します。
CoLA (Corpus of Linguistic Acceptability): 英語の文が文法的に許容できるかどうかを判断する、単一の文に対する 2 つのカテゴリの問題。
STS-B (セマンティックテキスト類似性ベンチマーク): 文ペアの類似性を計算します。
NLI: (自然言語推論)、2 つの文が同じ意味論、中立性、対立関係を持つと判断する、3 つの分類タスク
新しい最先端の結果: MNLI、QNLI、RTE、STS-B。
MNLI (Multi-Genre Natural Language Inference): 文章が類似しているか、矛盾しているか、無関係であるかを判断します
QNLI (質問自然言語推論): QA のペアが対応するかどうかを判断します。
RTE (テキスト含意の認識): MNLI に似ていますが、データ量が少なくなります。
STS-B (セマンティックテキスト類似性ベンチマーク): 文ペアの類似性を計算します。
テキスト マッチング タスクのアプリケーション:
検索、おすすめ、Q&Aなど。