LLM: actualización importante oficial de OpenAI: nueva función de actualización de la API de reconciliación GPT-3.5Turbo

LLM: actualización importante oficial de OpenAI: nueva función de actualización de la API de reconciliación GPT-3.5Turbo

Guía : el 22 de agosto de 2023, OpenAI lanzó oficialmente que los desarrolladores ahora pueden usar sus propios datos para personalizar el modelo GPT-3.5 Turbo para sus casos de uso. El ajuste fino para GPT-3.5 Turbo ya está disponible y el ajuste fino para GPT-4 estará disponible este otoño. Esta actualización permite a los desarrolladores personalizar modelos para proporcionar un mejor rendimiento para sus casos de uso y ejecutar esos modelos personalizados a escala. Las pruebas preliminares muestran que una versión mejorada de GPT-3.5 Turbopuede igualar las capacidades del nivel básico GPT-4, o incluso funcionar mejor en algunas tareas específicas . Al igual que con todas nuestras API, los datos enviados a la API de ajuste son propiedad del cliente y no serán utilizados por OpenAI ni por ninguna otra organización para entrenar otros modelos.

Tabla de contenido

ejemplo de ajuste fino

pasos de ajuste

Paso 1, prepara tus datos

Paso 2, sube archivos

Paso 3, cree un trabajo de ajuste

Paso 4, use el modelo ajustado

seguridad

precios

El modelo GPT-3 actualizado


Dirección de publicación de blog : GPT-3.5 Turbo, ajuste fino y actualizaciones de API

Dirección de la guía de ajuste : https://platform.openai.com/docs/guides/fine-tuning

ejemplo de ajuste fino

Desde el lanzamiento de GPT-3.5 Turbo, los desarrolladores y las empresas han estado buscando la capacidad de personalizar modelos para crear experiencias únicas y diferenciadas para sus usuarios . Con esta versión, los desarrolladores ahora pueden ejecutar ajustes supervisados ​​para que el modelo funcione mejor para su caso de uso.

En nuestra versión beta privada, los clientes de ajuste han podido mejorar significativamente el rendimiento del modelo en casos de uso comunes, como: >> Controlabilidad
mejorada : el ajuste permite a las empresas seguir mejor las instrucciones , como hacer que la salida sea más concisa o terminar siempre en Responder en un idioma determinado. Por ejemplo, los desarrolladores pueden utilizar el ajuste fino para garantizar que un modelo siempre responda en alemán cuando se le solicite en alemán. >> Formato de salida confiable : el ajuste fino mejora la capacidad del modelo para formatear respuestas de manera consistente , lo cual es fundamental para aplicaciones que requieren un formato de respuesta específico, como completar código o componer llamadas API. Los desarrolladores pueden utilizar el ajuste para convertir de forma más fiable las indicaciones de los usuarios en fragmentos JSON de alta calidad que puedan utilizarse con sus propios sistemas. >> Tono personalizado : el ajuste fino es una excelente manera de perfeccionar la sensación cualitativa de la salida de un modelo (como su tono), haciéndolo más acorde con la voz de la marca corporativa. Las empresas con una voz de marca reconocible pueden utilizar Nudge para hacer que el modelo sea más coherente con su tono.

Además de mejorar el rendimiento, el ajuste permite a las empresas acortar las indicaciones y, al mismo tiempo, garantizar un rendimiento similar . El ajuste con GPT-3.5 Turbo también puede procesar tokens de 4k, el doble que nuestro modelo ajustado anterior. Los primeros evaluadores han reducido el tamaño de la pista hasta en un 90%, acelerando cada llamada a la API y reduciendo los costos al ajustar las instrucciones en el modelo mismo.

El ajuste fino funciona mejor cuando se combina con otras técnicas como ingeniería de sugerencias, recuperación de información y llamadas a funciones . Consulte nuestra guía de ajuste para obtener más información. La compatibilidad con ajustes con llamadas a funciones y gpt-3.5-turbo-16k estará disponible a finales de este otoño.

pasos de ajuste

Paso 1, prepara tus datos

{
  "messages": [
    { "role": "system", "content": "You are an assistant that occasionally misspells words" },
    { "role": "user", "content": "Tell me a story." },
    { "role": "assistant", "content": "One day a student went to schoool." }
  ]
}

Paso 2, sube archivos

curl https://api.openai.com/v1/files \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F "purpose=fine-tune" \
  -F "file=@path_to_your_file" 

Paso 3, cree un trabajo de ajuste

curl https://api.openai.com/v1/fine_tuning/jobs \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
  "training_file": "TRAINING_FILE_ID",
  "model": "gpt-3.5-turbo-0613"
}'

Una vez que un modelo ha completado el proceso de ajuste, está inmediatamente listo para usarse en producción con los mismos límites de velocidad compartidos que el modelo base.

Paso 4, use el modelo ajustado

curl https://api.openai.com/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
  "model": "ft:gpt-3.5-turbo:org_id",
  "messages": [
    {
      "role": "system",
      "content": "You are an assistant that occasionally misspells words"
    },
    {
      "role": "user",
      "content": "Hello! What is fine-tuning?"
    }
  ]
}'

También implementaremos una interfaz de usuario de ajuste en un futuro cercano, lo que permitirá a los desarrolladores acceder más fácilmente a información sobre trabajos de ajuste en progreso, instantáneas de modelos completados y más.

seguridad

Para nosotros, las implementaciones afinadas son muy importantes. Para preservar las características de seguridad del modelo predeterminado a través del proceso de ajuste, los datos de entrenamiento ajustados se pasan a través de nuestra API de moderación y un sistema de moderación impulsado por GPT-4 para detectar datos de entrenamiento inseguros que entran en conflicto con nuestros estándares de seguridad.

precios

El costo de ajuste se divide en dos partes: costo de capacitación inicial y costo de uso:
>> capacitación : $0.008 / 1K tokens
>> usando entrada : $0.012 / 1K tokens
>> usando salida : $0.016 / 1K tokens

Por ejemplo, para un trabajo de ajuste fino de gpt-3.5-turbo con un archivo de entrenamiento de 100 000 tokens , el costo esperado es de $2,40 después de 3 épocas de entrenamiento .

El modelo GPT-3 actualizado

En julio, anunciamos que los modelos base GPT-3 originales (ada, babbage, curie y davinci) cerrarían el 4 de enero de 2024. Hoy en día, ofrecemos babbage-002 y davinci-002 como reemplazos para estos modelos , ya sea como modelos básicos o como modelos mejorados. Los clientes pueden acceder a estos modelos consultando la API de terminaciones.

Estos modelos se pueden ajustar utilizando nuestro nuevo punto final API /v1/fine_tuning/jobs. Este nuevo punto final proporciona paginación y más extensibilidad para respaldar el desarrollo futuro de la API de ajuste. La transición de /v1/fine-tunes a puntos finales más nuevos es sencilla; puede encontrar más detalles en nuestra nueva guía de ajuste fino. Esto desactivará el antiguo punto final /v1/fine-tunes, que se cerrará el 4 de enero de 2024.

El precio del modelo base y el modelo GPT-3 mejorado es el siguiente:

Supongo que te gusta

Origin blog.csdn.net/qq_41185868/article/details/132565612
Recomendado
Clasificación