Tabla de contenido
Introducción a varios modelos.
descripción general
Modelo | describir |
---|---|
GPT-4 beta limitada |
Un conjunto de modelos mejorados en GPT-3.5 que pueden comprender y generar código o lenguaje natural |
GPT-3.5 | Un conjunto de modelos mejorados en GPT-3 que pueden comprender y generar código o lenguaje natural |
DARLE Beta |
Modelos que pueden generar y editar imágenes dadas las señales del lenguaje natural |
Susurro Beta |
Un modelo que puede convertir audio a texto |
incrustaciones | Un conjunto de modelos que pueden convertir texto a forma digital. |
Moderación | Un modelo perfeccionado que puede detectar si el texto es confidencial o inseguro |
GPT-3 | Un conjunto de modelos que pueden comprender y generar lenguaje natural. |
Códice Obsoleto |
Un conjunto de modelos que pueden comprender y generar código, incluida la traducción del lenguaje natural a código. |
GPT-4 (beta limitada)
GPT-4 es un gran modelo multimodal (toma entrada de texto y emite salida de texto hoy, entrada de imagen en el futuro) que puede resolver problemas difíciles con mayor precisión que cualquiera de nuestros modelos anteriores debido a su sentido común más amplio y capacidad de razonamiento de alto nivel. Al igual que gpt-3.5-turbo, GPT-4 está optimizado para chat, pero también es adecuado para tareas de finalización tradicionales mediante la API de finalización de chat.
Ultimo Modelo | describir | FICHAS MÁXIMAS | fecha de datos de entrenamiento |
---|---|---|---|
gpt-4 | Más potente que cualquier modelo GPT-3.5, capaz de realizar tareas más complejas y optimizado para el chat. Se actualizará con nuestra última versión del modelo. | 8,192 fichas | Hasta septiembre de 2021 |
gpt-4-0314 | Una instantánea de gpt-4 el 14 de marzo de 2023. A diferencia de gpt-4, este modelo no recibe actualizaciones y queda obsoleto 3 meses después del lanzamiento de una nueva versión. | 8,192 fichas | Hasta septiembre de 2021 |
gpt-4-32k | Misma funcionalidad que el modo base gpt-4, pero con 4 veces la longitud del contexto. Se actualizará con nuestra última versión del modelo. | 32,768 fichas | Hasta septiembre de 2021 |
gpt-4-32k-0314 | Instantánea de gpt-4-32 14 de marzo de 2023. A diferencia de gpt-4-32k, este modelo no recibirá actualizaciones y quedará obsoleto 3 meses después del lanzamiento de una nueva versión. | 32,768 fichas | Hasta septiembre de 2021 |
Para muchas tareas básicas, la diferencia entre los modelos GPT-4 y GPT-3.5 no es significativa. Sin embargo, en situaciones de inferencia más complejas, GPT-4 es más capaz que cualquiera de nuestros modelos anteriores.
GPT-3.5
Los modelos GPT-3.5 pueden comprender y generar código o lenguaje natural. Nuestro modelo más potente y rentable de la familia GPT-3.5 es gpt-3.5-turbo, que está optimizado para el chat pero también es adecuado para las tareas de finalización tradicionales.
Ultimo Modelo | describir | FICHAS MÁXIMAS | fecha de datos de entrenamiento |
---|---|---|---|
gpt-3.5-turbo | El modelo GPT-3.5 más poderoso y optimizado para chat a 1/10 del costo de text-davinci-003. Se actualizará con nuestra última versión del modelo. | 4,096 fichas | Hasta septiembre de 2021 |
gpt-3.5-turbo-0301 | La instantánea gpt-3.5-turbo del 1 de marzo de 2023. A diferencia de gpt-3.5-turbo, este modelo no recibirá actualizaciones y quedará obsoleto 3 meses después del lanzamiento de una nueva versión. | 4,096 fichas | Hasta septiembre de 2021 |
texto-davinci-003 | Puede realizar cualquier tarea de lenguaje con mejor calidad, resultados más largos y seguimiento de instrucciones consistente que los modelos Curie, Babbage o ada. También se admite la inserción de terminaciones en el texto. de |
4,097 fichas | Hasta junio de 2021 |
texto-davinci-002 | Característica similar a text-davinci-003, pero entrenada usando ajuste fino supervisado en lugar de aprendizaje por refuerzo | 4,097 fichas | Hasta junio de 2021 |
código-davinci-002 | Optimizado para tareas de finalización de código | 8,001 fichas | Hasta junio de 2021 |
Recomendamos gpt-3.5-turbo sobre otros modelos GPT-3.5 debido a su menor costo.
GPT-3
El modelo GPT-3 puede comprender y generar lenguaje natural. Estos modelos fueron reemplazados por el modelo de generación GPT-3.5 más potente. Sin embargo, los modelos básicos originales de GPT-3 (davinci, curie, ada y babbage) son actualmente los únicos disponibles para realizar ajustes.
Ultimo Modelo | describir | FICHAS MÁXIMAS | fecha de datos de entrenamiento |
---|---|---|---|
texto-curie-001 | Muy capaz, más rápido y menos costoso que Davinci. | 2,049 fichas | Hasta octubre de 2019 |
texto-babbage-001 | 能够执行简单的任务,速度非常快,成本更低。 | 2,049 tokens | Up to Oct 2019 |
text-ada-001 | 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。 | 2,049 tokens | Up to Oct 2019 |
davinci | 功能最强大的 GPT-3 模型。 可以完成其他模型可以完成的任何任务,而且通常质量更高。 | 2,049 tokens | Up to Oct 2019 |
curie | 非常有能力,但比Davinci更快,成本更低。 | 2,049 tokens | Up to Oct 2019 |
babbage | 能够执行简单的任务,速度非常快,成本更低。 | 2,049 tokens | Up to Oct 2019 |
ada | 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。 | 2,049 tokens | Up to Oct 2019 |
各类模型介绍
DALL·E Beta
DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品。 目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。
通过Open API 提供的当前 DALL·E 模型是 DALL·E 的第 2 次迭代,具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。 您可以通过我们的实验室界面或 API 进行试用。
产生图片的一些官网提供例子
编辑图片的例子
Whisper Beta
Whisper 是一种通用的语音识别模型。 它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过我们的 API 使用 whisper-1 模型名称获得。
目前,Whisper 的开源版本与通过我们的 API 提供的版本之间没有区别。 然而,通过Open API,我们提供了一个优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。
Embeddings
嵌入是文本的数字表示,可用于衡量两段文本之间的相关性。 我们的第二代嵌入模型 text-embedding-ada-002 旨在以一小部分成本取代之前的 16 种第一代嵌入模型。 嵌入可用于搜索、聚类、推荐、异常检测和分类任务。
Moderation
审核模型旨在检查内容是否符合 OpenAI 的使用政策。 这些模型提供了查找以下类别内容的分类功能:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片。
审核模型接受任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。
MODEL | DESCRIPTION |
---|---|
text-moderation-latest | 最有能力的审核模型。 精度会略高于稳定模型 |
text-moderation-stable |
Codex (deprecated)
Codex 模型现已弃用。 他们是我们 GPT-3 模型的后代,可以理解和生成代码 他们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。 了解更多。
他们最擅长 Python,精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至 Shell 等十几种语言。
以下 Codex 模型现已弃用:
最新的模型 | 描述 | 最大的 TOKENS | 训练数据日期 |
---|---|---|---|
code-davinci-002 | 功能最强大的 Codex 型号。 特别擅长将自然语言翻译成代码。 除了补全代码,还支持在代码中插入补全。 的 |
8,001 tokens | Up to Jun 2021 |
code-davinci-001 | ode-davinci-002 的早期版本 |
8,001 tokens | Up to Jun 2021 |
code-cushman-002 | 几乎与 Davinci Codex 一样强大,但速度稍快。 这种速度优势可能使其成为实时应用程序的首选。 | Up to 2,048 tokens | |
code-cushman-001 | code-cushman-002 的早期版本 | Up to 2,048 tokens |
Todo el contenido anterior proviene de https://platform.openai.com/docs/models