¿Qué debo hacer si encuentro fluctuaciones anormales en los datos? Que no cunda el pánico, el seguimiento de indicadores y el análisis de atribución están aquí para ayudarle

La creación de un sistema de indicadores completo e integral es el primer paso para que las empresas utilicen datos para guiar las decisiones de operaciones comerciales. Pero después de establecer los indicadores, a menudo todos ignoran el seguimiento de los mismos. Cuando los indicadores fluctúan de manera anormal (hacia arriba o hacia abajo), las empresas deben poder detectarlos a tiempo y encontrar rápidamente las verdaderas razones detrás de ellos, para poder formular las estrategias correspondientes. De lo contrario, simplemente darán en el blanco a ciegas y darán vueltas. círculos.

Escenarios específicos donde los indicadores fluctúan anormalmente, tales como:

· El tráfico de búsqueda de palabras clave empresariales disminuyó repentinamente.

· El dato de GMV en marzo cayó un 40% respecto a febrero. ¿Cómo analizarlo?

· El número de pedidos en una determinada categoría ha aumentado considerablemente recientemente.

Luego, este artículo presentará en detalle cómo establecer un monitoreo completo de anomalías de indicadores y el mecanismo de análisis de atribución correspondiente , de modo que cuando encuentre tales problemas en el futuro, pueda descubrir rápidamente problemas y oportunidades comerciales a partir de los datos y mejorar la velocidad del negocio. avance.

Detección de anomalías en indicadores basada en análisis estadístico.

Las tendencias de los datos diarios de las empresas fluctuarán hacia arriba y hacia abajo dentro de un cierto rango, pero los rangos flotantes de diferentes indicadores serán diferentes. Cuando el negocio se encuentra en un período de rápido crecimiento, el rango de fluctuación diaria de los indicadores es mayor; cuando el negocio se encuentra en un período estable, el rango de fluctuación diaria de los indicadores es menor, cuanto más gruesa es la granularidad estadística, mayor es la cantidad de datos; , y menor será la volatilidad de los resultados estadísticos. Por lo tanto, es necesario utilizar diferentes estándares para diferentes indicadores para medir si existen anomalías en las fluctuaciones de los indicadores.

Hay tres métodos principales para monitorear las anomalías de los indicadores:

· Establecimiento de umbrales basados ​​en la experiencia empresarial real

· Realizar análisis estadísticos basados ​​en los resultados de los datos.

· Integrar algoritmos en las predicciones de modelado.

Este artículo presentará principalmente cómo evaluar si las fluctuaciones de los indicadores son anormales basándose en métodos de análisis estadístico .

En estadística, la distribución de datos de los indicadores suele satisfacer la distribución normal . La distribución normal es simétrica y utiliza dos datos: media y desviación estándar. La media puede reflejar el nivel promedio de los datos y la desviación estándar puede reflejar el rango de fluctuación de los datos. Cuanto mayor es la desviación estándar, mayor es la volatilidad de los datos. La fórmula para calcular la desviación estándar es la siguiente:

archivo

La posición de los datos en la distribución normal se puede utilizar para determinar si las fluctuaciones del indicador están en línea con las expectativas. En la distribución normal, la probabilidad de que los datos se distribuyan dentro de 2 veces la desviación estándar es del 95,5% y la probabilidad de que estén dentro de 3 veces la desviación estándar es del 99,7%. En la vida diaria, se puede utilizar 2 veces la desviación estándar como estándar de medición.

Los resultados de los datos normales fluctuarán dentro del rango de la desviación estándar media ±2*. Si los datos reales exceden este rango, la fluctuación de los datos se considera anormal.

Los patrones de fluctuación de datos diarios tendrán patrones de cambio iguales o similares en unidades de días, semanas, meses y años. Aquí, tomamos el indicador de actividad diaria como ejemplo para ilustrar el proceso de monitoreo de fluctuaciones anormales del indicador.

El indicador de actividad diaria de una determinada aplicación de juego generalmente fluctúa semanalmente. Ahora planeamos determinar si hay fluctuaciones anormales en los datos de actividad diaria de este lunes en función de las tendencias de los datos de las últimas cinco semanas.

La preparación de datos es la siguiente:

archivo

El valor promedio de los lunes en las primeras cinco semanas de los datos anteriores es: 10900, desviación estándar: 1507. Las 2 veces la desviación estándar de los datos son 7887 y 13913 respectivamente. Los datos del lunes de esta semana son 7700. Si es afuera. el rango de desviación estándar de 2 veces, significa que la actividad en un día de esta semana es Los datos del indicador fluctúan de manera anormal y se requiere un análisis más detallado para determinar si las fluctuaciones anormales son realmente anormales en el negocio.

Análisis de atribución de cambios de indicadores.

Existen muchos métodos de atribución para cambios de indicadores , que se pueden resumir en dos categorías: análisis de atribución horizontal y análisis de atribución vertical.

Análisis de atribución horizontal

El análisis de atribución horizontal significa que para indicadores combinados, los indicadores de proceso se pueden dividir, se pueden analizar los factores que influyen en la fluctuación de cada indicador de proceso y luego se pueden integrar y analizar los múltiples factores que influyen.

Por ejemplo: el monto del pago de ayer aumentó significativamente. Al analizar las razones del aumento, primero desglose el monto del pago: monto del pago = actividad diaria * monto promedio del pago El monto promedio del pago fluctúa dentro del rango normal y la actividad diaria aumentó significativamente. Se constató que el volumen de compras aumentó ayer impactando los resultados.

análisis de atribución vertical

El análisis de atribución vertical consiste en realizar un análisis de atribución de indicadores mediante un desglose de dimensiones . El análisis detallado de dimensiones incluye principalmente dos granularidades de análisis: una es analizar la contribución de cada dimensión al indicador y la otra es analizar la contribución del valor de la dimensión al indicador.

El cálculo del grado de contribución de una dimensión se puede calcular en función del resumen del grado de contribución de cada valor de dimensión. Existen muchos métodos de cálculo para calcular el grado de contribución de cada valor de dimensión. diversos métodos, como los algoritmos de predicción. Este artículo presenta un método simple para calcular el grado de contribución en función de la tasa de crecimiento promedio.

En una sola dimensión, la contribución de cada valor de dimensión se puede calcular mediante la siguiente fórmula:

archivo

A continuación, tome las ventas como ejemplo para presentar el proceso de cálculo.

Las ventas de una determinada línea de productos el 1 y 2 de enero fueron de 30,97 millones de yuanes y 33 millones de yuanes respectivamente. Desglosado en la dimensión de la ciudad, el rendimiento de los datos de dos días de cada ciudad es el siguiente:

archivo

En la dimensión ciudad:

archivo

Con base en los pasos anteriores, el cálculo de la contribución de la dimensión y la contribución del valor de la dimensión se puede realizar de manera sencilla.

Monitoreo inteligente de fluctuaciones de indicadores y análisis de atribución inteligente

En escenarios de datos reales, la cantidad de valores de dimensión en cada dimensión varía de decenas a cientos y miles. Calcular la contribución de la dimensión manualmente todos los días será una gran carga de trabajo. La eficiencia del análisis es demasiado baja, lo que facilita que las partes empresariales saquen conclusiones basadas en la experiencia. Si la inferencia es incorrecta, lo más probable es que se tomen decisiones equivocadas.

Las funciones inteligentes de monitoreo de fluctuaciones de indicadores y análisis de atribución inteligente de Kangaroo Cloud Indicator Platform pueden ayudar de manera rápida y completa a los usuarios a rastrear el desempeño comercial, promoviendo así aún más el desarrollo comercial.

Ver panel de indicadores

Para los indicadores que preocupan a la empresa, se pueden agregar indicadores al tablero de atención para la observación y el monitoreo diario de datos. En el panel, puede ver visualmente el rendimiento de los datos actuales y las tendencias de datos recientes de todos los indicadores. El sistema realizará un diagnóstico inteligente basado en los datos actuales para determinar si las fluctuaciones del indicador son fluctuaciones normales, ayudará a los usuarios a localizar rápidamente datos anormales y analizará y responderá a los cambios de datos de manera específica.

archivo

Análisis de atribución de métricas

Cuando el resultado de un indicador es anormal, requiere mucho trabajo realizar un análisis de atribución en dimensiones y valores de dimensiones en secuencia. Ser capaz de sistematizar los métodos y procesos de análisis mejorará enormemente la eficiencia del análisis de atribución y tendrá un papel extremadamente positivo en la promoción del desarrollo empresarial.

archivo

Al realizar el análisis de atribución de indicadores, el sistema diferenciará entre las fluctuaciones de los indicadores de cálculo del valor de dimensión, calculará aún más la contribución de la dimensión y las ordenará en orden descendente según la contribución, lo que permitirá a los usuarios centrarse en los factores de influencia más importantes.

En la dimensión de preocupación, los usuarios pueden verificar más a fondo la contribución de los valores de dimensión subdivididos, descubrir rápidamente los motivos de los cambios en los datos y promover la mejora empresarial a través de los datos.

Haga clic en el siguiente enlace para probar [ Plataforma de gestión de indicadores ] de forma gratuita: https://www.dtstack.com/easydigit/dataindex?src=szsm

Dirección de descarga del "Libro técnico del sistema de indicadores industriales": https://www.dtstack.com/resources/1057?src=szsm

Dirección de descarga del "Informe técnico del producto Dutstack": https://www.dtstack.com/resources/1004?src=szsm

Dirección de descarga del "Libro técnico sobre prácticas de la industria de gobernanza de datos": https://www.dtstack.com/resources/1001?src=szsm

Para aquellos que quieran saber o consultar más sobre productos de big data, soluciones industriales y casos de clientes, visite el sitio web oficial de Kangaroo Cloud: https://www.dtstack.com/?src=szkyzg

Linus se encargó de evitar que los desarrolladores del kernel reemplazaran las pestañas con espacios. Su padre es uno de los pocos líderes que puede escribir código, su segundo hijo es el director del departamento de tecnología de código abierto y su hijo menor es un núcleo de código abierto. Colaborador Robin Li: El lenguaje natural se convertirá en un nuevo lenguaje de programación universal. El modelo de código abierto se quedará cada vez más atrás de Huawei: tomará 1 año migrar completamente 5,000 aplicaciones móviles de uso común a Hongmeng, que es el lenguaje más propenso. Vulnerabilidades de terceros. Se lanzó el editor de texto enriquecido Quill 2.0 con características, confiabilidad y experiencia de desarrolladores que Ma Huateng y Zhou Hongyi se dieron la mano para "eliminar los rencores". La fuente de Laoxiangji no es el código, las razones detrás de esto son muy conmovedoras. Google anunció una reestructuración a gran escala.
{{o.nombre}}
{{m.nombre}}

Supongo que te gusta

Origin my.oschina.net/u/3869098/blog/11049507
Recomendado
Clasificación