El ciclo de vida de un modelo de aprendizaje automático

Mueve tu manita para hacer una fortuna, ¡dale un pulgar hacia arriba!

alternativa

¿Cómo cambia tu modelo? Fuente [1]

el nacimiento

Estas herramientas digitales nacen cuando construimos, entrenamos, ajustamos o estimamos nuestros modelos. Esta etapa prácticamente comienza con tener los objetivos de análisis, los datos, las computadoras, los algoritmos y todo lo demás que un científico de datos ya sabe muy bien. Cualesquiera que sean las otras herramientas que recopile, nunca pierda de vista sus objetivos analíticos o científicos para que su modelo final tenga sentido y satisfaga necesidades específicas. ¿Cuándo nació tu modelo? El ciclo de vida de la herramienta comienza cuando completa la capacitación y la guarda para su empleo/implementación.

alternativa

¿Qué futuro tiene este recién nacido? Esto dependerá del objetivo del análisis, por lo que no podemos olvidar esta parte al construirlo. El modelo puede servir para tareas de pronóstico, interpretación de indicadores o simulaciones de escenarios hipotéticos, entre muchas otras opciones. Esta herramienta se utilizará para ciertas cosas. Puede ser algo simple y rápido, o algo complejo, lento y de largo plazo. Este uso determinará la vida restante del modelo. Si el modelo se utiliza para una interpretación única de los parámetros, no queda mucha vida. Pero si el modelo se usa para la predicción y está destinado a servir a un sistema con recopilación de datos en línea, la vida está al alcance de la mano para este recién nacido. que sigue

mantener

A medida que continuamos usando el modelo, las condiciones de los datos que respaldan el entrenamiento del modelo comenzarán a cambiar. En ese momento de cambio, el modelo también empieza a sufrir cambios. Si construimos un modelo de predicción de abandono con alta precisión de predicción en el momento del entrenamiento, entonces, en un futuro cercano o lejano, las condiciones o comportamientos de los clientes a predecir comenzarán a cambiar. Esta variación desafía el desempeño predictivo de nuestros modelos aprendidos. Cuando se producen estos cambios, nuestro modelo entra en una nueva fase, a la que llamamos mantenimiento.

Durante la fase de mantenimiento, es posible que necesitemos nuevos datos. Con él, podemos actualizar las especificaciones del modelo. No es diferente a tomar otra máquina (como un automóvil) y ajustar las piezas cuando la máquina no funciona como debería. No profundizaremos en estrategias o soluciones para realizar el mantenimiento del modelo, pero en general, nuestros modelos deben pasar por un proceso de ajuste para que vuelvan a tener un rendimiento satisfactorio.

alternativa

Mantener un modelo de aprendizaje automático no es lo mismo que volver a entrenar un modelo. Algunos modelos pueden ser tan simples que volver a entrenarlos con datos más nuevos es igual de simple. Este puede ser el caso de arquitecturas lineales o redes con pocas capas y neuronas. Pero cuando el modelo es tan complejo y tiene una arquitectura grande y profunda, la fase de mantenimiento debe ser mucho más simple que el costo de volver a entrenar el modelo. Este es uno de los temas más importantes en el aprendizaje automático actual, porque las herramientas son muy poderosas, pero costosas de mantener a largo plazo.

Una vez que se modifica o actualiza un modelo, se puede volver a poner en uso, por lo que cualquier proceso que el modelo esté sirviendo puede continuar usando la versión actualizada. Nuestras máquinas se pueden seguir utilizando. Aún así, la máquina ha cambiado. Ha sido usado, consumido y transformado en algo ligeramente diferente de su estado original, por así decirlo. Al igual que los lápices, nuestros modelos llegan a un punto en el que necesitamos afilar sus puntas para protegerlos y poder seguir usándolos.

emigrar

En el camino del aprendizaje automático, es posible que debamos tomar una salida: la transferencia. Una vez visité la increíble Islandia cuando vi por primera vez a alguien cambiar los neumáticos de su coche y conducir por una carretera helada. Luego, cuando regresaron a la ciudad, volvieron a usar neumáticos de serie. Este concepto quedó muy claro cuando comencé a trabajar en el aprendizaje por transferencia mientras recordaba la conversión de neumáticos de automóviles en Islandia. Cuando entra en juego un nuevo entorno/dominio, nuestro modelo entra en una nueva fase llamada transferencia.

alternativa

Así como el mismo automóvil se puede adaptar a diferentes terrenos cambiando las llantas sin tener que comprar otro automóvil por separado, podemos agregar o modificar partes de nuestro modelo para cumplir nuevos propósitos en nuevas áreas sin tener que construir un nuevo modelo. El aprendizaje de transferencia es otro subcampo de investigación en la literatura de aprendizaje automático que busca optimizar los ajustes del modelo para simplificar la tarea de entrenar un modelo en un nuevo entorno. Un ejemplo popular son los modelos de reconocimiento de imágenes. Los entrenamos con ciertas clases de imágenes, y luego otros transfieren estos modelos para reconocer nuevas clases de imágenes. Muchas empresas ahora usan modelos como RegNet, VGG, Inception o AlexNet para ajustarlos a sus necesidades.

Cuando transferimos un modelo, en cierto modo, nace un modelo nuevo, que tiene su propio ciclo de vida, separado del modelo original. Requerirá mantenimiento al igual que el modelo original. Con esto, hemos pasado de tener una entidad inicial a crear potencialmente todo un conjunto de modelos. No hay duda de que, de hecho, hay un ciclo de vida detrás de estas herramientas digitales.

alternativa

¿Morirá nuestro modelo?

La respuesta corta es sí. Por ejemplo, pueden dejar de existir cuando su rendimiento analítico se queda corto sistemáticamente, o cuando se vuelven tan grandes y tan diversos que el modelo original es cosa del pasado. Como decíamos al principio, las piedras, los lápices y los coches dejan de existir en algún momento. En este sentido, los modelos no son diferentes de estas cosas.

Si bien el modelo puede extinguirse, la respuesta a la pregunta de cuándo llegaron a este punto es, hasta el día de hoy, la pregunta más importante que queremos que se responda en la comunidad de investigación de aprendizaje automático. Muchos desarrollos en el monitoreo del aprendizaje automático y el rendimiento del mantenimiento de modelos están relacionados con la cuestión de cuándo un modelo deja de funcionar.

Una de las razones por las que esta respuesta no es trivial es porque constantemente necesitamos etiquetas para cuantificar la satisfacción del desempeño. Pero la mayor paradoja del aprendizaje automático y estadístico es precisamente que las etiquetas no están disponibles y construimos estas herramientas para predecirlas. Otra razón es que definir los límites de aceptación para los cambios de rendimiento puede ser muy subjetivo. Si bien los científicos pueden establecer algunos límites, las empresas pueden tener diferentes tolerancias.

Aquí hay algunos puntos que los científicos de datos también pueden considerar al responder esta pregunta (actualmente abierta):

  • ¿Los datos de entrenamiento están desactualizados? (que es "demasiado anticuado")
  • ¿Qué tan similar es la versión actual a la versión original del modelo? (¿Qué es "similar"?)
  • ¿Está completamente desviada la variabilidad de las características de entrada y la relación con la variable de destino? (Covariables y desviación de conceptos, dos de los temas más importantes en la investigación de mantenimiento del aprendizaje automático).
  • ¿Sigue en uso el proceso físico para implementar el modelo? Si la infraestructura física ya no puede soportar el despliegue del modelo, esto sin duda marca el final de su ciclo de vida.

Ya no vivir como modelo no es necesariamente algo negativo, es más como un camino evolutivo para ellos. Necesitamos comprender su ciclo de vida para mantener nuestros sistemas físicos y digitales actualizados y funcionando satisfactoriamente.

Referencia

[1]

Fuente:https://towardsdatascience.com/the-lifetime-of-a-machine-learning-model-392e1fadf84a

Este artículo es publicado por mdnice multiplataforma

Supongo que te gusta

Origin blog.csdn.net/swindler_ice/article/details/130958635
Recomendado
Clasificación