复旦团队开源大模型 MOSS

首先解释一下我们的MOSS版本,目前开源的版本我们称为MOSS 003,二月份公开邀请内测的版本为MOSS 002,一月份我们还有一个内部测试版本叫做OpenChat 001,这里正好简单介绍一下我们的历次迭代过程。

 

OpenChat 001

在去年ChatGPT问世后,国内NLP从业者受到冲击很大,当时没有llama也没有alpaca,大家普遍认为我们距离ChatGPT有一到两年的技术差距。而要做ChatGPT有两个部分是很昂贵的,一个是数据标注,一个是预训练算力。我们没有算力,但是可以想办法构造一些数据来试试看,毕竟AI都强大到能替代这么多人的工作了,没理由认为它替代不了标注人员的工作。于是我们当时从OpenAI的论文附录里扒了一些它们API收集到的user prompt,然后用类似Self-Instruct的思路用text-davinci-003去扩展出大约40万对话数据。没错,跟今天的alpaca类似,而且我们当时还是多轮对话而不是单轮指令。之后在16B基座(CodeGen)上做了一下fine-tune,发现似乎稍微大点的模型很容易学到指令遵循能力,下面是当时的一些示例。

OpenChat 001 指令遵循能力

OpenChat 001 多轮对话能力

猜你喜欢

转载自blog.csdn.net/qq_41771998/article/details/130300155