LLMs:LLMs大语言模型评估的简介(六大维度)、常见评估基准—单任务评估基准(BLEU/ROUGE)+多任务评估基准(SuperGLUE/MMLU/BIG-bench/HELM/AGIEval/C-EVAL)、使用方法之详细攻略
目录
相关文章