GPT-3 模型特点

Overview

模型 描述
GPT-3 一组能够理解和生成自然语言的模型
Codex Limited beta 一组可以理解和生成代码的模型,包括将自然语言转换为代码
Content filter 一种经过微调的模型,可以检测文本是否敏感或不安全

GPT-3

最新模型 描述 最大请求 训练数据
text-davinci-003 功能最强的GPT-3模型。可以做任何其他模型可以做的任务,通常具有更高的质量,更长的输出和更好的指令遵循。还支持在文本中插入补全。 4000 tokens 截至2021年6月
text-curie-001 功能非常强大,但比davincie更快,成本更低。 2048 tokens 截至2019年10月
text-babbage-001 能够完成简单的任务,速度快,成本低。 2048 tokens 截至2019年10月
text-ada-001 能够完成非常简单的任务,通常是GPT-3系列中速度最快的型号,成本最低。 2048 tokens 截至2019年10月

Davinci

Davinci是最有能力的模型家族,可以执行其他模型可以执行的任何任务,而且通常需要较少的指令。对于需要大量理解内容的应用程序,例如针对特定受众的摘要和创造性内容生成,Davinci将产生最好的结果。这些增加的功能需要更多的计算资源,因此Davinci每次API调用的成本更高,速度也不如其他模型快。

Davinci的另一个亮点是对文本意图的理解。Davinci善于解决各种逻辑问题,善于解释人物的动机。Davinci已经能够解决一些涉及因果关系的最具挑战性的人工智能问题。

擅长:复杂的意图,因果关系,对用户的总结

Curie

Curie非常强大,而且非常快。虽然Davinci在分析复杂文本方面更强,但Curie在处理情感分类和总结等微妙任务方面相当有能力。Curie还非常擅长回答问题和进行问答,并作为一个通用聊天机器人。

擅长:语言翻译、复杂分类、文本感悟、总结

Babbage

Babbage可以执行简单的分类等简单的任务。当涉及到语义搜索时,它也很有能力对文档与搜索查询的匹配程度进行排名。

擅长:适度分类,语义搜索分类

Ada

Ada通常是最快的模型,可以执行文本解析、地址更正和某些类型的分类任务,这些任务不需要太多的细微差别。Ada的表现通常可以通过提供更多的上下文来提高。

擅长:文本解析,简单分类,地址更正,关键词

注:任何由Ada等更快的模型执行的任务都可以由Curie或Davinci等更强大的模型执行。

OpenAI模型是非确定性的,这意味着相同的输入可以产生不同的输出。将 temperature 设置为0将使输出大部分是确定的,但可能会保留少量的可变性。

猜你喜欢

转载自blog.csdn.net/m0_60641871/article/details/128944482