De la base de conocimientos al robot interactivo: el tutorial de GPT lo ayuda a crear un sistema de diálogo inteligente basado en contenido


7068d7a7b3a6a7131c3109680a9b5880.jpeg

1. Introducción

Esta idea surge de mis necesidades personales. He serializado casi 100 boletines y acumulado mucho contenido. Espero importar estos materiales a AI, y luego AI puede usar estos datos para responder mis preguntas e incluso darme algunas sugerencias de escritura. Espere.

Al principio, probé un método muy estúpido, que consiste en pasar el texto de mi boletín a AI cuando hago preguntas, y su mensaje probablemente sea así:

Por favor, resuma las siguientes oraciones para que sean más fáciles de entender.

Texto: """
Mi boletín
"""


Se puede usar este método, pero actualmente Cha**GPT tiene un límite muy grande. Limita la cantidad máxima de tokens a 4096, que son aproximadamente 16 000 caracteres. Tenga en cuenta que esta es una solicitud + respuesta, y la cantidad total real de solicitudes no tantos. En otras palabras, no puedo importar demasiado contenido a Cha**GPT a la vez (mi Newsletter tiene casi 5000 palabras), este problema se me ha atascado durante mucho tiempo, hasta que vi el Índice GPT  y el  ;Lennys Newsletter ejemplo.

Pruébelo, es muy fácil de usar y los pasos son muy simples, incluso si no sabe programar, puede seguir fácilmente los pasos para realizar esta función.

Optimicé ligeramente el código del siguiente ejemplo y agregué algunas introducciones a los principios. Espero que a todos les guste.

2. Introducción al principio

De hecho, existen métodos preparados para mis necesidades en el campo de los robots tradicionales. Por ejemplo, debería ver muchos productos de servicio al cliente de comercio electrónico con funciones similares. Si dice una palabra, el robot le responderá.

Este robot tradicional generalmente se basa en la intención de responder preguntas humanas. Por ejemplo, construimos un robot de servicio al cliente y su principio de funcionamiento es el siguiente:

016af78fc0e6f412cc5fdbf6dcac4c70.jpeg

Cuando el usuario pregunta "¿Qué debo hacer si olvidé mi contraseña?", Encontrará la "contraseña" más cercana a la intención. Habrá muchas preguntas de muestra en cada intención, como "Cómo recuperar la contraseña olvidada" y "¿Qué debo hacer si olvido la contraseña?" Estas preguntas de muestra tendrán una respuesta "Haga clic en el botón A para recuperar su contraseña", y el bot buscará la intención más cercana a la pregunta de muestra y devolverá la respuesta.

Pero hay un problema con esto. Necesitamos establecer muchas intenciones, como "no se puede iniciar sesión", "olvidé la contraseña" y "error de inicio de sesión". Aunque todas pueden describir una cosa, debemos establecer tres intenciones y tres conjuntos de preguntas y respuesta.

Aunque los robots tradicionales tienen muchas limitaciones, este enfoque tradicional nos ha dado algo de inspiración.

Parece que podemos usar este método para resolver el problema de restringir tokens. Solo necesitamos pasar documentos que cumplan con una determinada intención a AI, y luego AI solo usará este documento para generar una respuesta:

22a83fef503d928e5546fd4410960fcb.jpeg

Por ejemplo, en el ejemplo del robot de servicio al cliente anterior, cuando el usuario pregunta "¿Qué debo hacer si olvido mi contraseña?", la intención relacionada con "iniciar sesión" se compara y luego los documentos con la misma intención o similar en la base de conocimiento coincide, como "Documento de solución de manejo de excepciones de inicio de sesión", y finalmente pasamos este documento a GPT-3, que luego usa el contenido de este documento para generar una respuesta.

La comprensión simple de la biblioteca GPTIndex es hacer la parte de la izquierda de la imagen de arriba, y su principio de funcionamiento es el siguiente:

  1. Crear una base de conocimientos o un índice de documentos
  2. encontrar el índice más relevante
  3. Finalmente, dar el contenido del índice correspondiente a GPT-3

3. Restricciones y puntos de atención

Aunque este método resuelve el problema de las restricciones de tokens, también tiene muchas limitaciones:

  1. Cuando el usuario hace algunas preguntas vagas, la coincidencia puede ser incorrecta, lo que hace que GPT-3 obtenga el contenido incorrecto y, finalmente, genere una respuesta muy escandalosa.
  2. Los bots a veces generan información falsa cuando los usuarios solicitan información sin mucho contexto.

Así que si quieres utilizar esta tecnología como un robot de atención al cliente, te sugiero:

  1. Utilice algunas preguntas guía para aclarar primero las intenciones del usuario, lo cual es similar a los robots tradicionales de servicio al cliente, para hacer algunos botones y permitir que el usuario haga clic primero (por ejemplo, no puede iniciar sesión).
  2. Si la similitud es demasiado baja, se recomienda agregar una respuesta de abajo hacia arriba "Lo siento, no puedo responder a su pregunta, ¿necesita cambiar al servicio de atención al cliente manual?"

4. Practica

Para que sea más fácil de usar para todos, puse el código en Google Colab, no necesitas instalar ningún entorno, solo abre esto con un navegador: Archivo de código

Por cierto, puedes copiarlo y guardarlo en tu Google Drive.

información

He recibido comentarios de muchos amigos de que no se puede hacer clic en el botón de abajo. La siguiente es solo una captura de pantalla, debe abrir este archivo de código para operar. Además, en cuanto al problema de que la respuesta no cumple con las expectativas, es principalmente el problema de la coincidencia de vectores, y no hay solución por el momento.

Paso 1: Importar datos

Hay dos formas de importar, la primera es importar datos en línea.

Importar datos de GitHub es relativamente fácil. Si lo está utilizando por primera vez, le sugiero que pruebe este método primero. Al hacer clic en el botón de reproducción antes del código a continuación, se ejecutará el código.

af2578a00f249215d57d7ccd489656ab.jpeg

Después de ejecutarse, importará varios boletines que escribí. Si también desea importar datos como yo, simplemente modifique la dirección del enlace detrás del clon.

El segundo método es importar datos sin conexión. Haga clic en el botón de la carpeta a la izquierda (si no ha iniciado sesión, este paso le permitirá iniciar sesión), luego haga clic en el botón de carga marcado con 2 en la figura a continuación para cargar el archivo. Si desea cargar varios archivos, se recomienda que primero cree una carpeta y luego cargue todos los archivos en esta carpeta.

238ad79d6b8c0c8f8f38a32813e121fe.jpeg

Paso 2 y 3: instalar bibliotecas dependientes

Simplemente haga clic en el botón de reproducción.

Pero en el tercer paso, puede intentar cambiar los parámetros, puede cambiar:

  1. num_ouputs: Esto es para establecer el número máximo de tokens de salida. Cuanto mayor sea el número, más palabras podrá responder la máquina al responder preguntas.
  2. Temperatura:  Esto es principalmente para controlar la aleatoriedad de los resultados generados por el modelo. En resumen, cuanto más baja es la temperatura, más seguros son los resultados, pero también más mundanos o poco interesantes. Si desea obtener algunas respuestas inesperadas, es posible que desee aumentar este parámetro. Pero si su escenario es un escenario basado en hechos, como la extracción de datos y los escenarios de preguntas frecuentes, es mejor establecer este parámetro en 0.

Simplemente deje los otros parámetros solos, no es un gran problema.

Paso 4: establecer la clave API de OpenAI

Esto requiere que inicie sesión en OpenAI (tenga en cuenta que OpenAI no es Cha**GPT), haga clic en el avatar en la esquina superior derecha, haga clic en Ver claves API, o puede acceder directamente haciendo clic en este enlace. Luego haga clic en "Crear nueva clave secreta", luego copie esa clave y péguela en el documento.

e9b1233d3032ccc34cf53d736f678bb5.jpeg

Paso cinco: construir el índice

Este paso se ejecutará a través de los datos importados en el primer paso y utilizará la API de incrustaciones de OpenAI. Si cargó sus propios datos en el primer paso, simplemente cambie Jimmy-Newsletter-Corpus en ' ' por el nombre de la carpeta que cargó.

Aviso:

  • Este paso consumirá su crédito OpenAI. El precio de 1000 tokens es de $ 0.02. Antes de ejecutar el siguiente código, debe prestar atención a si hay dinero en su cuenta.
  • Si la cuenta de OpenAI que está utilizando es una cuenta gratuita, es posible que encuentre una advertencia de frecuencia. En este momento, puede esperar un momento antes de ejecutar el siguiente código (además, los datos de su base de conocimiento importados son demasiados, también desencadenar). La mejor manera de eliminar esta restricción es vincular una tarjeta de crédito en la página Facturación de su cuenta de OpenAI. Cómo vincular la tarjeta, debe buscar por sí mismo.

Sexto paso: hacer preguntas

En este paso, puede intentar hacer preguntas. Si importó mis datos preestablecidos en el primer paso, puede intentar hacer las siguientes preguntas:

  • ¿Cuál es el contenido principal del número 90?
  • Recomendar un libro similar al mencionado en el número 90

Si está importando sus propios datos, también puede hacer los siguientes tipos de preguntas:

  • Resumir
  • hacer preguntas
  • extracción de información

Lo anterior es una breve introducción. Siga y envíe un mensaje privado para obtener materiales de aprendizaje gratuitos de GPT, materiales de aprendizaje de pintura de IA de Midjourney y tutoriales de GoGPT.VIP;

Busque el taller de innovación de IA GOGPT, adopte AI, adopte GPT, adopte un futuro brillante.

818b2c8f3290b4490fa110c559993a3f.jpeg

Supongo que te gusta

Origin blog.csdn.net/siyu471384214/article/details/131545054
Recomendado
Clasificación