Grandes modelos y bases de datos: impulso bidireccional en la era de la IA

Con el advenimiento de la era AIGC, el modelo de lenguaje grande (LLM) encabezado por GPT se ha convertido en uno de los temas más candentes en el campo de la inteligencia artificial en la actualidad. Estos poderosos modelos no solo funcionan bien en tareas como generación creativa de contenido, traducción de idiomas y asistencia de código, sino que también tienen un impacto revolucionario en el desarrollo de bases de datos.

1 Modelo de lenguaje grande: una nueva era de interacción persona-computadora

A lo largo del desarrollo de la civilización humana, el lenguaje siempre ha sido una parte importante de la evolución y el progreso continuo de la civilización. Desde las primeras transmisiones orales hasta la aparición de las palabras escritas, los métodos de comunicación y expresión del lenguaje se han mejorado continuamente, permitiendo que el conocimiento y las ideas se transmitan a través del tiempo y el espacio.

El continuo avance de la ciencia y la tecnología ha llevado al nacimiento de uno de los mayores inventos de la humanidad, la computadora, y con ella un lenguaje completamente nuevo: el lenguaje de máquina. El lenguaje de máquina es un conjunto de instrucciones que una computadora puede comprender y ejecutar. El lenguaje de máquina se ejecuta de manera muy eficiente dentro de una computadora, pero para los humanos, escribir y leer directamente el lenguaje de máquina es una tarea tediosa y compleja. Para simplificar la interacción con la computadora, los humanos inventaron el lenguaje ensamblador, que representa instrucciones en lenguaje de máquina como mnemónicos, pero aún así requiere un alto nivel técnico para escribir y comprender.

Con el mayor desarrollo de la tecnología informática, los humanos han inventado lenguajes de programación de alto nivel, que se acercan más a los lenguajes naturales y hacen que la programación sea simple y humana. Sin embargo, los lenguajes de programación de alto nivel están limitados por compiladores e intérpretes, lo que limita su capacidad para expresar y comprender declaraciones complejas. La gente está ansiosa por hacer que sea más fácil interactuar con las máquinas e, idealmente, hacer que las máquinas comprendan verdaderamente el lenguaje natural.

Bajo esta demanda surgió la inteligencia artificial. Durante más de 60 años desde su nacimiento, la gente ha estado trabajando arduamente para estudiar el procesamiento del lenguaje natural (PNL) y se ha comprometido a hacer que las máquinas comprendan el lenguaje natural con mayor precisión y ejecuten los comandos correspondientes para lograr una interacción más inteligente. con los humanos.

PNL: el vínculo entre la interacción persona-computadora

(Fuente: easyai.tech) 

El 30 de noviembre de 2022, OpenAI lanzó ChatGPT, un gran modelo de lenguaje basado en tecnología GPT, que demostró un nivel impactante de inteligencia artificial y rápidamente se convirtió en el foco de atención de todos los ámbitos de la vida. Antes de esto, nunca ha habido un modelo de lenguaje tan poderoso como ChatGPT, y su lanzamiento marca una nueva era de interacción persona-computadora.

2 Potente empoderamiento de los principales modelos lingüísticos

La aparición de ChatGPT ha desencadenado una nueva ronda de locura por la IA. Para ponerse al día con la ola de los tiempos provocada por ChatGPT, cada vez más empresas de tecnología han desarrollado sus propios modelos de lenguaje a gran escala y las herramientas de IA generadas en base a estos grandes modelos son más Hay innumerables, que cubren muchos campos como programación, bases de datos, audio, video, traducción de idiomas, conversación y chat, etc.

Áreas de aplicación de modelos grandes. 

(Fuente: aigeneración.substack.com) 

Por ejemplo, en términos de programación, Github Copilot y Mintlify son asistentes de código de IA basados ​​​​en modelos grandes. El primero puede generar sugerencias de código apropiadas basadas en el contexto y los comentarios del código del desarrollador, lo que ayuda a los desarrolladores a mejorar la eficiencia y la calidad de la programación y reducir la duplicación y engorroso trabaja y realiza tus ideas fácilmente.

Asistente de programación de IA Github Copilot

(Fuente: github.blog) 

Este último puede generar comentarios de código basados ​​en la semántica y el contexto del código, lo que reduce la carga de los desarrolladores para escribir comentarios y mejora la legibilidad y el mantenimiento del código.

Herramienta de anotación de código Mintlify

(Fuente: g2.com) 

Además, los grandes modelos lingüísticos también han tenido un gran impacto en otros campos. En términos de escritura, se pueden utilizar modelos de lenguaje grandes para la generación de texto, reescritura de párrafos, revisión inteligente, etc. En el campo de las imágenes, los modelos de lenguaje grandes pueden lograr funciones como generación de imágenes, reparación de imágenes y eliminación del fondo de imágenes.

El modelo del gran lenguaje no es sólo una tecnología, sino también un importante motor del desarrollo de la economía digital. Con el vigoroso desarrollo de la economía digital, los datos han superado hasta cierto punto a la tierra, la mano de obra, la tecnología y el capital, convirtiéndose en el quinto factor de producción más poderoso para promover el crecimiento económico. En la era de la economía digital, cada día se generan y procesan cantidades masivas de datos. Detrás de esto, hay una tecnología que es particularmente importante: es la "tecnología raíz" de la economía digital y un vínculo importante entre las aplicaciones de capa superior. y los recursos básicos subyacentes. También se conoce como la base. La “joya de la corona” del software es la base de datos.

3. Cuando los grandes modelos de lenguaje se encuentran con las bases de datos

Las bases de datos son componentes centrales de los sistemas de información modernos y se utilizan para almacenar, gestionar y recuperar grandes cantidades de datos estructurados y no estructurados. Con el crecimiento explosivo de los datos y las demandas de los usuarios de consultas y análisis más avanzados, los sistemas de bases de datos tradicionales enfrentan desafíos. Como resultado, las bases de datos comenzaron a integrarse e innovar con diversas tecnologías emergentes, como la computación en la nube, big data, blockchain, etc., lo que dio como resultado una serie de nuevas bases de datos con funciones más poderosas, que brindan más opciones y soluciones para los sistemas de información modernos.

Entonces, ¿qué tipo de chispas pueden surgir de la colisión entre grandes modelos de lenguaje y bases de datos?

3.1 Aplicación de grandes modelos en el campo de las bases de datos.

Los modelos de lenguaje grandes pueden potenciar los sistemas de bases de datos en muchos aspectos, logrando así un mejor rendimiento de ejecución y logrando inteligencia. Las siguientes son las dimensiones de aplicación de algunos modelos de lenguaje grandes en bases de datos:

  • NL2SQL (lenguaje natural a SQL)

La interacción con bases de datos tradicionales requiere el uso de lenguaje de consulta estructurado (SQL) u otros lenguajes de programación, lo que puede resultar difícil de aprender y comprender para profesionales no técnicos. NL2SQL se refiere a la tecnología que convierte el lenguaje natural (NL) en lenguaje de consulta estructurado (SQL). Su objetivo es permitir que los profesionales no técnicos interactúen con bases de datos utilizando lenguaje natural sin tener que escribir consultas complejas.

SQL Chat es una herramienta de cliente SQL conversacional interactiva basada en un modelo grande. Proporciona una interfaz fácil de usar que permite a los usuarios interactuar con la base de datos a través de conversaciones en lenguaje natural.

En comparación con el modo GUI tradicional, SQL Chat presta más atención a la facilidad de uso y la naturalidad. Simula la comunicación conversacional entre personas y los usuarios pueden hacerle preguntas en un lenguaje natural sin estar familiarizados con la sintaxis y estructura específicas de las declaraciones de consulta SQL. Este método de interacción similar a un chat permite a los usuarios sin experiencia técnica comunicarse y consultar fácilmente la base de datos.

SQL Chat convierte el lenguaje natural en declaraciones de consulta SQL 

Al proporcionar un método de interacción más intuitivo y natural, SQL Chat reduce el umbral para usar SQL y proporciona al personal no técnico una experiencia de operación de bases de datos más conveniente y amigable. Este método de interacción simplifica enormemente el proceso de interacción entre los usuarios y la base de datos y mejora la usabilidad y facilidad de uso de la base de datos.

  • Optimización del rendimiento de la base de datos

La optimización del rendimiento de la base de datos siempre ha sido uno de los problemas más problemáticos para los administradores de bases de datos y los desarrolladores. Es una tarea extremadamente compleja que involucra muchos aspectos, incluido el hardware, el diseño del sistema, el diseño de la estructura de la base de datos, la optimización de consultas SQL, la estrategia de índice y la administración de caché. .

Entre ellos, la optimización de consultas SQL es el método de optimización del rendimiento de la base de datos al que los desarrolladores están más expuestos y el más utilizado. El objetivo de la optimización de consultas SQL es reducir el tiempo de respuesta de las consultas, reducir la carga de la base de datos y mejorar la eficiencia de las consultas a través de diversos medios.

En términos generales, la velocidad de ejecución de una consulta SQL está relacionada con muchos factores, como la calidad de la declaración SQL en sí, el plan de ejecución generado por la base de datos, el mecanismo de caché de la base de datos, el tamaño de la tabla de datos y la complejidad de la consulta. condiciones de consulta. El plan de ejecución de la base de datos está relacionado con el caché. El mecanismo está determinado por sus propias especificaciones de desarrollo y diseño y no se puede cambiar fácilmente. Por lo tanto, en el mismo entorno de base de datos, la eficiencia de la ejecución de la consulta depende de la calidad de Sentencias de consulta SQL, rendimiento de sentencias SQL de alta calidad y sentencias SQL de baja calidad ... El rendimiento es muy diferente.

Sin embargo, muchos programadores de SQL no pueden escribir declaraciones SQL de alta calidad, e incluso los administradores de bases de datos experimentados dedican mucho tiempo y energía a optimizar una consulta SQL compleja. Hasta la aparición de grandes modelos de lenguaje, el ajuste de SQL ya no es una pesadilla para los administradores de bases de datos.

El modelo de lenguaje grande puede analizar una declaración de consulta SQL determinada y proporcionar sugerencias de optimización y reescritura de consultas. Puede inferir métodos de consulta potencialmente más eficientes basados ​​en la estructura y la semántica de las declaraciones de consulta y proporcionar rápidamente las sugerencias de optimización correspondientes, lo que reduce en gran medida la carga para los desarrolladores y mantenedores.

Utilice SQL Chat para optimizar las declaraciones de consulta 

3.2 La base de datos promueve la optimización y el desarrollo de modelos grandes.

Los modelos de lenguaje grandes son esencialmente modelos de lenguaje basados ​​en arquitecturas de redes neuronales que están previamente entrenadas con conjuntos de datos a gran escala y tienen una gran cantidad de parámetros (generalmente miles de millones o más). La potencia informática, los algoritmos y los datos, como los tres elementos principales de la inteligencia artificial, también son factores importantes para promover el desarrollo de grandes modelos.

El entrenamiento y la inferencia de grandes modelos de lenguaje requieren una gran cantidad de recursos informáticos. La mejora de la potencia informática permite que el modelo realice un entrenamiento más profundo en conjuntos de datos más grandes, mejorando así su comprensión del lenguaje y sus capacidades de generación; los algoritmos mejorados continuamente pueden optimizar el modelo. La estructura y los métodos de capacitación lo hacen más efectivo en la utilización de recursos informáticos, aceleran el proceso de convergencia y mejoran la eficiencia de la capacitación; los datos son la clave para el surgimiento de capacidades de modelos grandes. Los modelos de lenguaje grandes están completamente impulsados ​​por datos , y el proceso de capacitación requiere un gran cantidad de recursos de datos. La cantidad, calidad y diversidad de los datos de entrenamiento son cruciales para entrenar modelos de lenguaje grandes.

Como herramienta central para almacenar y administrar datos, las bases de datos pueden proporcionar capacidades eficientes de almacenamiento y recuperación de datos y respaldar el entrenamiento de grandes modelos de lenguaje. Al almacenar datos en una base de datos, la lectura y el procesamiento por lotes se pueden realizar fácilmente, lo que mejora la disponibilidad de los datos y la eficiencia de la capacitación.

Tomando como ejemplo ChatGPT, el modelo de lenguaje grande más popular en la actualidad, el modelo GPT-3 tiene hasta 175 mil millones de parámetros. Los datos muestran que el consumo total de energía informática requerido para el entrenamiento del modelo GPT-3 es de 3640 PF-días. , con un costo de alrededor de 12 millones de dólares estadounidenses; lo que es aún más impactante es que, según la información recopilada por expertos de la industria, el modelo GPT-4 recientemente lanzado tiene un volumen de parámetros de hasta 1,76 billones. Cuanto mayor sea el número de parámetros, más inteligente será el modelo, pero mayor será la sobrecarga. Los requisitos de potencia de cálculo están estrechamente relacionados con la magnitud del parámetro, que también es una referencia importante para medir actualmente la calidad del entrenamiento de modelos grandes. En otras palabras, la potencia informática es la fuente subyacente de potencia para entrenar modelos grandes. Una base de potencia informática excelente puede mejorar en gran medida el efecto del entrenamiento de modelos grandes. El éxito de ChatGPT se beneficia de los potentes servicios de computación en la nube proporcionados por Microsoft Azure.

Los requisitos de potencia informática para entrenar modelos grandes están creciendo rápidamente

(Fuente: blogs.nvidia.com) 

Se puede ver que para las empresas que desean tener sus propios modelos grandes, los enormes requisitos informáticos de datos y los altos costos informáticos son dos "grandes montañas" frente a ellos. Incluso si obtienen el código de un modelo grande complejo, es No cualquiera puede correr. Por lo tanto, el modelo de lenguaje grande no es solo el resultado de algoritmos complejos, sino que también depende del soporte de los servicios de computación en la nube , incluido el suministro de recursos en diversos aspectos, como la informática, el almacenamiento y las bases de datos.

4 modelo grande + base de datos: 1+1>2

La integración de grandes modelos de lenguaje y bases de datos promoverá el desarrollo de aplicaciones de bases de datos y de interacción persona-computadora. La combinación de los dos es una situación en la que todos ganan. Al aprovechar las capacidades de comprensión y generación del lenguaje de los grandes modelos de lenguaje, el uso y la gestión Las bases de datos se volverán más convenientes y eficientes.Inteligente: la base de datos proporciona conjuntos de datos de alta calidad y una gestión de datos eficiente para respaldar la capacitación y la aplicación de grandes modelos de lenguaje. La combinación de bases de datos y modelos grandes seguramente se convertirá en una tendencia importante en el desarrollo de ambos en el futuro.

El sistema de computación de datos de modelo grande Tuoshupai (πDataComputing System, abreviado como πDataCS) se lanzará en el foro tecnológico anual de la compañía el 24 de octubre de este año y tiene como objetivo convertirse en la base tecnológica básica de la IA, con una fuerte innovación tecnológica y una solidez de producto líder . La industria tiene grandes esperanzas y cree que el sistema de computación de datos de modelo grande abrirá un nuevo paradigma de la tecnología de inteligencia artificial.

 


 

 

Bun lanza la versión oficial 1.0, un error mágico en el Explorador de archivos de Windows cuando JavaScript es tiempo de ejecución escrito por Zig , mejora el rendimiento en un segundo JetBrains lanza Rust IDE: RustRover PHP últimas estadísticas: la participación de mercado supera el 70%, el rey de los CMS trasplanta programas Python a Mojo, el rendimiento aumenta 250 veces y la velocidad es más rápida que C. El rendimiento de .NET 8 ha mejorado enormemente, muy por delante de .NET 7. Comparación de los tres principales tiempos de ejecución de JS: Deno, Bun y Node.js Visual Studio Code 1.82 NetEase Fuxi respondió a los empleados "debido a un ERROR, fue amenazado por Recursos Humanos y falleció. El motor Unity cobrará según la cantidad de instalaciones del juego (tarifa de tiempo de ejecución) a partir del próximo año.
{{o.nombre}}
{{m.nombre}}

Supongo que te gusta

Origin my.oschina.net/u/5944765/blog/10110640
Recomendado
Clasificación