GPT-3 模型特点

Overview

模型	描述
GPT-3	一组能够理解和生成自然语言的模型
Codex Limited beta	一组可以理解和生成代码的模型，包括将自然语言转换为代码
Content filter	一种经过微调的模型，可以检测文本是否敏感或不安全

GPT-3

最新模型	描述	最大请求	训练数据
text-davinci-003	功能最强的GPT-3模型。可以做任何其他模型可以做的任务，通常具有更高的质量，更长的输出和更好的指令遵循。还支持在文本中插入补全。	4000 tokens	截至2021年6月
text-curie-001	功能非常强大，但比davincie更快，成本更低。	2048 tokens	截至2019年10月
text-babbage-001	能够完成简单的任务，速度快，成本低。	2048 tokens	截至2019年10月
text-ada-001	能够完成非常简单的任务，通常是GPT-3系列中速度最快的型号，成本最低。	2048 tokens	截至2019年10月

Davinci

Davinci是最有能力的模型家族，可以执行其他模型可以执行的任何任务，而且通常需要较少的指令。对于需要大量理解内容的应用程序，例如针对特定受众的摘要和创造性内容生成，Davinci将产生最好的结果。这些增加的功能需要更多的计算资源，因此Davinci每次API调用的成本更高，速度也不如其他模型快。

Davinci的另一个亮点是对文本意图的理解。Davinci善于解决各种逻辑问题，善于解释人物的动机。Davinci已经能够解决一些涉及因果关系的最具挑战性的人工智能问题。

擅长:复杂的意图，因果关系，对用户的总结

Curie

Curie非常强大，而且非常快。虽然Davinci在分析复杂文本方面更强，但Curie在处理情感分类和总结等微妙任务方面相当有能力。Curie还非常擅长回答问题和进行问答，并作为一个通用聊天机器人。

擅长:语言翻译、复杂分类、文本感悟、总结

Babbage

Babbage可以执行简单的分类等简单的任务。当涉及到语义搜索时，它也很有能力对文档与搜索查询的匹配程度进行排名。

擅长:适度分类，语义搜索分类

Ada

Ada通常是最快的模型，可以执行文本解析、地址更正和某些类型的分类任务，这些任务不需要太多的细微差别。Ada的表现通常可以通过提供更多的上下文来提高。

擅长:文本解析，简单分类，地址更正，关键词

注:任何由Ada等更快的模型执行的任务都可以由Curie或Davinci等更强大的模型执行。

OpenAI模型是非确定性的，这意味着相同的输入可以产生不同的输出。将 temperature 设置为0将使输出大部分是确定的，但可能会保留少量的可变性。

Overview

GPT-3

Davinci

Curie

Babbage

Ada

猜你喜欢