Introducción a todos los modelos actuales de OpenAI

Tabla de contenido

descripción general

GPT-4 (beta limitada)

GPT-3.5

GPT-3

Introducción a varios modelos.

DALL-E Beta

Susurro Beta

incrustaciones

Moderación

Códice (obsoleto)


descripción general

Modelo describir
GPT-4

beta limitada

Un conjunto de modelos mejorados en GPT-3.5 que pueden comprender y generar código o lenguaje natural
GPT-3.5 Un conjunto de modelos mejorados en GPT-3 que pueden comprender y generar código o lenguaje natural
DARLE

Beta

Modelos que pueden generar y editar imágenes dadas las señales del lenguaje natural
Susurro

Beta

Un modelo que puede convertir audio a texto
incrustaciones Un conjunto de modelos que pueden convertir texto a forma digital.
Moderación Un modelo perfeccionado que puede detectar si el texto es confidencial o inseguro
GPT-3 Un conjunto de modelos que pueden comprender y generar lenguaje natural.
Códice

Obsoleto

Un conjunto de modelos que pueden comprender y generar código, incluida la traducción del lenguaje natural a código.

GPT-4 (beta limitada)

GPT-4 es un gran modelo multimodal (toma entrada de texto y emite salida de texto hoy, entrada de imagen en el futuro) que puede resolver problemas difíciles con mayor precisión que cualquiera de nuestros modelos anteriores debido a su sentido común más amplio y capacidad de razonamiento de alto nivel. Al igual que gpt-3.5-turbo, GPT-4 está optimizado para chat, pero también es adecuado para tareas de finalización tradicionales mediante la API de finalización de chat. 

Ultimo Modelo describir FICHAS MÁXIMAS fecha de datos de entrenamiento
gpt-4 Más potente que cualquier modelo GPT-3.5, capaz de realizar tareas más complejas y optimizado para el chat. Se actualizará con nuestra última versión del modelo. 8,192 fichas Hasta septiembre de 2021
gpt-4-0314 Una instantánea de gpt-4 el 14 de marzo de 2023. A diferencia de gpt-4, este modelo no recibe actualizaciones y queda obsoleto 3 meses después del lanzamiento de una nueva versión. 8,192 fichas Hasta septiembre de 2021
gpt-4-32k Misma funcionalidad que el modo base gpt-4, pero con 4 veces la longitud del contexto. Se actualizará con nuestra última versión del modelo. 32,768 fichas Hasta septiembre de 2021
gpt-4-32k-0314 Instantánea de gpt-4-32 14 de marzo de 2023. A diferencia de gpt-4-32k, este modelo no recibirá actualizaciones y quedará obsoleto 3 meses después del lanzamiento de una nueva versión. 32,768 fichas Hasta septiembre de 2021

Para muchas tareas básicas, la diferencia entre los modelos GPT-4 y GPT-3.5 no es significativa. Sin embargo, en situaciones de inferencia más complejas, GPT-4 es más capaz que cualquiera de nuestros modelos anteriores.

GPT-3.5

Los modelos GPT-3.5 pueden comprender y generar código o lenguaje natural. Nuestro modelo más potente y rentable de la familia GPT-3.5 es gpt-3.5-turbo, que está optimizado para el chat pero también es adecuado para las tareas de finalización tradicionales.

Ultimo Modelo describir FICHAS MÁXIMAS fecha de datos de entrenamiento
gpt-3.5-turbo El modelo GPT-3.5 más poderoso y optimizado para chat a 1/10 del costo de text-davinci-003. Se actualizará con nuestra última versión del modelo. 4,096 fichas Hasta septiembre de 2021
gpt-3.5-turbo-0301 La instantánea gpt-3.5-turbo del 1 de marzo de 2023. A diferencia de gpt-3.5-turbo, este modelo no recibirá actualizaciones y quedará obsoleto 3 meses después del lanzamiento de una nueva versión. 4,096 fichas Hasta septiembre de 2021
texto-davinci-003

Puede realizar cualquier tarea de lenguaje con mejor calidad, resultados más largos y seguimiento de instrucciones consistente que los modelos Curie, Babbage o ada. También se admite la inserción de terminaciones en el texto.

de

4,097 fichas Hasta junio de 2021
texto-davinci-002 Característica similar a text-davinci-003, pero entrenada usando ajuste fino supervisado en lugar de aprendizaje por refuerzo 4,097 fichas Hasta junio de 2021
código-davinci-002 Optimizado para tareas de finalización de código 8,001 fichas Hasta junio de 2021

Recomendamos gpt-3.5-turbo sobre otros modelos GPT-3.5 debido a su menor costo.

GPT-3  

El modelo GPT-3 puede comprender y generar lenguaje natural. Estos modelos fueron reemplazados por el modelo de generación GPT-3.5 más potente. Sin embargo, los modelos básicos originales de GPT-3 (davinci, curie, ada y babbage) son actualmente los únicos disponibles para realizar ajustes.

Ultimo Modelo describir FICHAS MÁXIMAS fecha de datos de entrenamiento
texto-curie-001 Muy capaz, más rápido y menos costoso que Davinci. 2,049 fichas Hasta octubre de 2019
texto-babbage-001 能够执行简单的任务,速度非常快,成本更低。 2,049 tokens Up to Oct 2019
text-ada-001 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。 2,049 tokens Up to Oct 2019
davinci 功能最强大的 GPT-3 模型。 可以完成其他模型可以完成的任何任务,而且通常质量更高。 2,049 tokens Up to Oct 2019
curie 非常有能力,但比Davinci更快,成本更低。 2,049 tokens Up to Oct 2019
babbage 能够执行简单的任务,速度非常快,成本更低。 2,049 tokens Up to Oct 2019
ada 能够执行非常简单的任务,通常是 GPT-3 系列中最快的型号,而且成本最低。 2,049 tokens Up to Oct 2019

各类模型介绍

DALL·E Beta

DALL·E 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品。 目前支持在提示的情况下创建具有特定大小的新图像、编辑现有图像或创建用户提供的图像的变体的能力。

通过Open API 提供的当前 DALL·E 模型是 DALL·E 的第 2 次迭代,具有比原始模型更逼真、更准确且分辨率高 4 倍的图像。 您可以通过我们的实验室界面或 API 进行试用。

产生图片的一些官网提供例子 

编辑图片的例子

​​​​​​​

Whisper Beta

Whisper 是一种通用的语音识别模型。 它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Whisper v2-large 模型目前可通过我们的 API 使用 whisper-1 模型名称获得。

目前,Whisper 的开源版本与通过我们的 API 提供的版本之间没有区别。 然而,通过Open API,我们提供了一个优化的推理过程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快得多。 

Embeddings

嵌入是文本的数字表示,可用于衡量两段文本之间的相关性。 我们的第二代嵌入模型 text-embedding-ada-002 旨在以一小部分成本取代之前的 16 种第一代嵌入模型。 嵌入可用于搜索、聚类、推荐、异常检测和分类任务。

Moderation

审核模型旨在检查内容是否符合 OpenAI 的使用政策。 这些模型提供了查找以下类别内容的分类功能:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片。

审核模型接受任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。

MODEL DESCRIPTION
text-moderation-latest 最有能力的审核模型。 精度会略高于稳定模型
text-moderation-stable

Codex (deprecated)


Codex 模型现已弃用。 他们是我们 GPT-3 模型的后代,可以理解和生成代码 他们的训练数据包含自然语言和来自 GitHub 的数十亿行公共代码。 了解更多。

他们最擅长 Python,精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL,甚至 Shell 等十几种语言。

以下 Codex 模型现已弃用:

最新的模型 描述 最大的 TOKENS 训练数据日期
code-davinci-002

功能最强大的 Codex 型号。 特别擅长将自然语言翻译成代码。 除了补全代码,还支持在代码中插入补全。

8,001 tokens Up to Jun 2021
code-davinci-001 ode-davinci-002的早期版本 8,001 tokens Up to Jun 2021
code-cushman-002 几乎与 Davinci Codex 一样强大,但速度稍快。 这种速度优势可能使其成为实时应用程序的首选。 Up to 2,048 tokens
code-cushman-001 code-cushman-002 的早期版本 Up to 2,048 tokens

Todo el contenido anterior proviene de https://platform.openai.com/docs/models

Supongo que te gusta

Origin blog.csdn.net/keeppractice/article/details/130545777
Recomendado
Clasificación