Baichuan 2: Open Large-scale Language Models

物联网 2023-09-16 17:57:31 阅读次数: 0

本文是LLM系列文章，针对《Baichuan 2: Open Large-scale Language Models
》的翻译。

Baichuan2：开放的大规模语言模型

摘要
1 引言
2 预训练
3 对齐
4 安全性
5 评估
6 相关工作
7 限制和道德考虑

摘要

大型语言模型（LLM）在基于自然语言指令的几个例子的各种自然语言任务中表现出了显著的性能，从而减少了对广泛功能工程的需求。然而，大多数强大的LLM都是封闭源代码的，或者对英语以外的语言的能力有限。在这份技术报告中，我们展示了百川2，这是一系列包含70亿和130亿参数的大型多语言模型，在2.6万亿token上从头开始训练。百川2在MMLU、CMMLU、GSM8K和HumanEval等公共基准测试上与其他类似规模的开源模型相匹配或优于其他开源模型。此外，百川2在医药、法律等垂直领域表现突出。我们将发布所有训练前模型检查点，以帮助研究界更好地了解百川2号的训练动态。

1 引言

2 预训练

3 对齐

4 安全性

5 评估

6 相关工作

7 限制和道德考虑

与其他大型语言模型一样，百川2也面临着伦理挑战。它容易产生偏见和毒性，特别是考虑到它的大部分训练数据来自互联网。尽管我们尽了最大努力使用Toxigen等基准来缓解这些问题，但风险无法消除，而且毒性往往会随着模型的大小而增加。此外，百川2号模型的知识是静态的，可能已经过时或不正确，这对医学或法律等需要最新信息的领域提出了挑战。虽然为了安全起见，该模型针对中文和英文进行了优化，但在其他语言中存在局限性，可能无法完全捕捉到与非中文文化相关的偏见。
还有滥用的可能性，因为该模型可能被用来生成有害或误导性的内容。尽管我们尽最大努力平衡安全性和实用性，但一些安全措施可能会显得过于谨慎，影响模型在某些任务中的可用性。我们鼓励用户负责任、合乎道德地使用百川2模型。同时，我们将继续优化这些问题，并在未来发布更新版本。

猜你喜欢

转载自blog.csdn.net/c_cpp_csharp/article/details/132853610

Baichuan 2: Open Large-scale Language Models

LLMs之Baichuan 2：《Baichuan 2: Open Large-scale Language Models》翻译与解读

[论文笔记]Baichuan 2: Open Large-scale Language Models

HaluEval： A Large-Scale Hallucination Evaluation Benchmark for Large Language Models

LLM | A Technical Report for Polyglot-Ko: Open-Source Large-Scale Korean Language Models论文详解

论文阅读 A Survey of Large Language Models 2

Challenges and Applications of Large Language Models

A Survey of Large Language Models Attribution

Large Language Models in Finance: A Survey

ChatGPT’s One-year Anniversary: Are Open-Source Large Language Models Catching up?

LLaMA Open and Efficient Foundation Language Models

LLaMA: Open and Efficient Foundation Language Models

Large-Scale and Language-Oblivious Code Authorship Identification

【论文精读】Emergent Abilities of Large Language Models

论文阅读 A Survey of Large Language Models 3

Are Emergent Abilities of Large Language Models a Mirage?

论文阅读 A Survey of Large Language Models 1

Enabling Large Language Models to Generate Text with Citations

Recommender Systems in the Era of Large Language Models (LLMs)

A Survey on Model Compression for Large Language Models

Augmented Large Language Models with Parametric Knowledge Guiding

论文解读：Large Language Models as Analogical Reasoners

TASKBENCH: BENCHMARKING LARGE LANGUAGE MODELS FOR TASK AUTOMATION

A Survey on Multimodal Large Language Models for Autonomous Driving

Trends in Integration of Knowledge and Large Language Models

A Survey of Text Watermarking in the Era of Large Language Models

Shortcut Learning of Large Language Models in Natural Language Understanding: A Survey，2020

【LLM系列之LLaMA】LLaMA: Open and Efficient Foundation Language Models

（四十五）：VATEX: A Large-Scale, High-Quality Multilingual Dataset for Video-and-Language Research

Efficient Large-Scale Language Model Training on GPU ClustersUsing Megatron-LM

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)