LLM：预训练语言模型的评估 - 代码天地

LLM：预训练语言模型的评估

业界资讯 2023-07-28 21:32:12 阅读次数: 0

评估预训练语言模型的优劣通常有以下几种方法：

困惑度（Perplexity）：困惑度是一种常用的评估语言模型的方法，它可以用来衡量模型对新数据的预测能力。困惑度越低，表示模型对数据的拟合效果越好。
语言模型下游任务：语言模型下游任务是指在特定任务上使用预训练语言模型进行微调，以便更好地适应该任务。通常，如果预训练语言模型在下游任务上表现良好，则说明该模型具有较好的泛化能力和语言理解能力。
人类评估：人类评估是指通过人工判断预训练语言模型生成的文本是否符合语法、逻辑和语义等方面的要求。虽然这种方法比较费时费力，但是它可以提供更加客观的评估结果。
对抗样本攻击：对抗样本攻击是指通过对预训练语言模型输入进行修改，使其输出错误结果或误导结果。通过对抗样本攻击，可以评估模型的鲁棒性和安全性。
多样性和一致性：多样性和一致性是指预训练语言模型在生成文本时是否有足够的创造力和一致性。如果模型生成的文本过于单调或者不一致，可能会影响其应用价值。
训练效率和存储空间：除了以上几个方面，评估预训练语言模型的优劣还需要考虑其训练效率和存储空间等因素。一般来说，训练效率和存储空间越小，表示该模型越实用

猜你喜欢

转载自blog.csdn.net/pipisorry/article/details/131165857

LLM：预训练语言模型的评估

LLM：finetune预训练语言模型

大语言模型(LLM)综述(四)：如何适应预训练后的大语言模型

大语言模型(LLM)综述(三)：大语言模型预训练的进展

LLM预训练大型语言模型Pre-training large language models

如何评估大型语言模型（LLM）？

大语言模型（LLM）评估综述

NLP预训练语言模型

预训练语言模型（一）

预训练语言模型综述

构建语言模型（二）：模型训练与评估

NLP中的语言模型预训练&微调

NLP中的预训练语言模型（二）

预训练语言模型 | (4) AlBert

预训练语言模型 | (3) Bert

预训练语言模型 | (2) transformer

预训练语言模型 | (1) 概述

ViLBERT：视觉-语言任务预训练模型

最新《知识增强预训练语言模型》

【深度学习】预训练语言模型-BERT

预训练语言模型（GPT，BERT）

大语言模型的持续预训练

大语言模型LLM Large Language Model 的涌现Emergence 反馈强化学习 RLHF 预训练 token word embeddings 温度 temperature=0.7

大语言模型的预训练[6]：思维链(Chain-of-thought，CoT)定义原理详解、Zero-shot CoT、Few-shot CoT 以及在LLM上应用

预训练语言模型综述（一）—— 预训练语言模型及其历史

预训练语言模型综述（三）—— 预训练语言模型的实际使用

大语言模型(LLM)综述(六)：大型语言模型的基准和评估

达摩院SPACE对话大模型：预训练语言模型，预训练对话模型，知识注入

【LLM系列之GPT】GPT（Generative Pre-trained Transformer）生成式预训练模型

超越时空：加速预训练语言模型的训练

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)