Que dois-je faire si je constate des fluctuations anormales dans les données ? Pas de panique, le suivi des indicateurs et l’analyse d’attribution sont là pour vous aider

La création d'un système d'indicateurs complet et exhaustif est la première étape permettant aux entreprises d'utiliser les données pour guider les décisions opérationnelles. Mais une fois les indicateurs fixés, le suivi des indicateurs est souvent ignoré par tout le monde. Lorsque les indicateurs fluctuent anormalement (à la hausse ou à la baisse), les entreprises doivent être capables de les détecter à temps et d'en trouver rapidement les véritables raisons, afin de pouvoir formuler des stratégies correspondantes. cercles.

Scénarios spécifiques où les indicateurs fluctuent anormalement, tels que :

· Le trafic de recherche des mots-clés d'entreprise a soudainement diminué. Quelle en est la raison ?

· Le chiffre du GMV en mars a chuté de 40% par rapport à février. Comment l'analyser ?

· Le nombre de commandes dans une certaine catégorie a fortement augmenté récemment. Pourquoi ?

Ensuite, cet article présentera en détail comment établir un mécanisme complet de surveillance des anomalies d'indicateur et un mécanisme d'analyse d'attribution correspondant , de sorte que lorsque vous rencontrerez de tels problèmes à l'avenir, vous puissiez rapidement découvrir les problèmes et les opportunités commerciales à partir des données et améliorer la vitesse des affaires. avancement.

Détection des anomalies des indicateurs basée sur une analyse statistique

Les tendances quotidiennes des données des entreprises fluctueront dans une certaine fourchette, mais les fourchettes flottantes des différents indicateurs seront différentes. Lorsque l'entreprise est dans une période de croissance rapide, la plage de fluctuation quotidienne des indicateurs est plus large ; lorsque l'entreprise est dans une période stable, la plage de fluctuation quotidienne des indicateurs est plus petite, plus la granularité statistique est grande, plus la quantité de données est importante ; , et plus la volatilité des résultats statistiques est faible. Par conséquent, différentes normes doivent être utilisées pour différents indicateurs afin de mesurer s’il existe des anomalies dans les fluctuations des indicateurs.

Il existe trois méthodes principales pour surveiller les anomalies des indicateurs :

· Définition de seuils basés sur l'expérience commerciale réelle

· Effectuer une analyse statistique basée sur les résultats des données

· Intégrer des algorithmes dans les prédictions de modélisation

Cet article présentera principalement comment évaluer si les fluctuations des indicateurs sont anormales sur la base de méthodes d'analyse statistique .

En statistiques, la distribution des données des indicateurs satisfait généralement à la distribution normale . La distribution normale est symétrique et utilise deux données : la moyenne et l'écart type. La moyenne peut refléter le niveau moyen des données et l'écart type peut refléter la plage de fluctuation des données. Plus l'écart type est grand, plus la volatilité des données est grande. La formule de calcul de l’écart type est la suivante :

déposer

La position des données dans la distribution normale peut être utilisée pour déterminer si les fluctuations de l'indicateur sont conformes aux attentes. Dans la distribution normale, la probabilité que les données soient distribuées dans un délai de 2 fois l'écart type est de 95,5 % et la probabilité qu'elles se situent dans un délai de 3 fois l'écart type est de 99,7 %. Dans la vie quotidienne, 2 fois l'écart type peut être utilisé comme étalon de mesure.

Les résultats des données normales fluctuent dans la plage de l'écart type moyen ±2*. Si les données réelles dépassent cette plage, la fluctuation des données est considérée comme anormale.

Les modèles de fluctuation des données quotidiennes auront des modèles de changement identiques ou similaires en unités de jours, semaines, mois et années. Ici, nous prenons l'indicateur d'activité quotidienne comme exemple pour illustrer le processus de surveillance des fluctuations anormales de l'indicateur.

L'indicateur d'activité quotidienne d'une certaine application de jeu fluctue généralement sur une base hebdomadaire. Nous prévoyons maintenant de déterminer s'il existe des fluctuations anormales dans les données d'activité quotidienne de ce lundi, en fonction des tendances des données des cinq dernières semaines.

La préparation des données est la suivante :

déposer

La valeur moyenne des lundis au cours des cinq premières semaines des données ci-dessus est : 10 900, écart type : 1 507. Les 2 fois l'écart type des données sont respectivement 7 887 et 13 913. Les données du lundi de cette semaine sont 7 700. Si c'est à l'extérieur. la plage d'écart type de 2 fois, cela signifie que l'activité d'un jour de cette semaine est anormale. Les données de l'indicateur fluctuent anormalement et une analyse plus approfondie est nécessaire pour déterminer si les fluctuations anormales sont vraiment anormales dans l'entreprise.

Analyse d’attribution des changements d’indicateurs

Il existe de nombreuses méthodes d'attribution pour les changements d'indicateurs , qui peuvent être résumées en deux catégories : l'analyse d'attribution horizontale et l'analyse d'attribution verticale.

Analyse d'attribution horizontale

L'analyse d'attribution horizontale signifie que pour les indicateurs combinés, les indicateurs de processus peuvent être divisés, les facteurs d'influence de fluctuation de chaque indicateur de processus peuvent être analysés, puis les multiples facteurs d'influence peuvent être intégrés et analysés.

Par exemple : le montant du paiement d’hier a considérablement augmenté. Lors de l'analyse des raisons de l'augmentation, décomposez d'abord le montant du paiement : montant du paiement = activité quotidienne * montant moyen du paiement. Le montant moyen du paiement fluctue dans la plage normale et l'activité quotidienne a augmenté de manière significative. il a été constaté que le volume des achats a augmenté hier, ce qui a eu un impact sur les résultats.

analyse d'attribution verticale

L'analyse d'attribution verticale consiste à effectuer une analyse d'attribution sur les indicateurs via une analyse approfondie des dimensions . L'analyse approfondie des dimensions comprend principalement deux granularités d'analyse : l'une consiste à analyser la contribution de chaque dimension à l'indicateur, et l'autre consiste à analyser la contribution de la valeur de la dimension à l'indicateur.

Le calcul du degré de contribution d'une dimension peut être calculé sur la base du résumé du degré de contribution de chaque valeur de dimension. Il existe de nombreuses méthodes de calcul pour calculer le degré de contribution de chaque valeur de dimension. diverses méthodes telles que les algorithmes de prédiction. Cet article présente une méthode simple pour calculer le degré de contribution en fonction du taux de croissance moyen.

Sous une seule dimension, la contribution de chaque valeur de dimension peut être calculée par la formule suivante :

déposer

Ensuite, prenons les ventes comme exemple pour présenter le processus de calcul.

Les ventes d'une certaine ligne de produits le 1er janvier et le 2 janvier étaient respectivement de 30,97 millions de yuans et 33 millions de yuans. Décomposées en fonction de la dimension de la ville, les performances des données sur deux jours de chaque ville sont les suivantes :

déposer

Dans la dimension ville :

déposer

Sur la base des étapes ci-dessus, le calcul de la contribution de dimension et de la contribution de valeur de dimension peut être simplement réalisé.

Surveillance intelligente des fluctuations des indicateurs et analyse intelligente de l'attribution

Dans les scénarios de données réels, le nombre de valeurs de dimension dans chaque dimension varie de dizaines à des centaines, voire des milliers. Le calcul manuel de la contribution de la dimension chaque jour représentera une charge de travail énorme. L'efficacité de l'analyse est trop faible, ce qui permet aux entreprises de tirer facilement des conclusions basées sur l'expérience. Si l'inférence est erronée, de mauvaises décisions seront probablement prises.

Les fonctions intelligentes de surveillance des fluctuations des indicateurs et d'analyse d'attribution intelligente de Kangaroo Cloud Indicator Platform peuvent aider rapidement et complètement les utilisateurs à suivre les performances de l'entreprise, favorisant ainsi davantage le développement commercial.

Afficher le tableau de bord des indicateurs

Pour les indicateurs qui préoccupent l'entreprise, des indicateurs peuvent être ajoutés au tableau d'attention pour l'observation et le suivi quotidiens des données. Dans le tableau de bord, vous pouvez visualiser visuellement les performances actuelles des données et les tendances récentes des données de tous les indicateurs. Le système effectuera un diagnostic intelligent basé sur les données actuelles pour déterminer si les fluctuations de l'indicateur sont des fluctuations normales, aidera les utilisateurs à localiser rapidement les données anormales, et analysera et réagira aux changements de données de manière ciblée.

déposer

Analyse d'attribution de métriques

Lorsqu'un résultat d'indicateur est anormal, il faut beaucoup de travail pour effectuer une analyse d'attribution sur les dimensions et les valeurs de dimension en séquence. Être capable de systématiser les méthodes et les processus d'analyse améliorera considérablement l'efficacité de l'analyse d'attribution et jouera un rôle extrêmement positif dans la promotion du développement commercial.

déposer

Lors de l'analyse d'attribution des indicateurs, le système différenciera les fluctuations des indicateurs de calcul de la valeur des dimensions, calculera davantage la contribution des dimensions et les triera par ordre décroissant en fonction de la contribution, permettant aux utilisateurs de se concentrer sur les facteurs d'influence les plus importants.

Sous la dimension de préoccupation, les utilisateurs peuvent vérifier davantage la contribution des valeurs de dimension subdivisées, découvrir rapidement les raisons des modifications des données et promouvoir l'amélioration de l'entreprise grâce aux données.

Cliquez sur le lien ci-dessous pour essayer gratuitement [ Indicator Management Platform ] : https://www.dtstack.com/easydigit/dataindex?src=szsm

Adresse de téléchargement du « Livre blanc sur le système d'indicateurs industriels » : https://www.dtstack.com/resources/1057?src=szsm

Adresse de téléchargement du « Livre blanc sur les produits Dutstack » : https://www.dtstack.com/resources/1004?src=szsm

Adresse de téléchargement du « Livre blanc sur les pratiques de l'industrie de la gouvernance des données » : https://www.dtstack.com/resources/1001?src=szsm

Pour ceux qui souhaitent en savoir ou en savoir plus sur les produits Big Data, les solutions industrielles et les cas clients, visitez le site officiel de Kangaroo Cloud : https://www.dtstack.com/?src=szkyzg

Linus a pris sur lui d'empêcher les développeurs du noyau de remplacer les tabulations par des espaces. Son père est l'un des rares dirigeants capables d'écrire du code, son deuxième fils est directeur du département de technologie open source et son plus jeune fils est un noyau open source. contributeur. Robin Li : Le langage naturel deviendra un nouveau langage de programmation universel. Le modèle open source prendra de plus en plus de retard sur Huawei : il faudra 1 an pour migrer complètement 5 000 applications mobiles couramment utilisées vers Java, qui est le langage le plus enclin . vulnérabilités tierces. L'éditeur de texte riche Quill 2.0 a été publié avec des fonctionnalités, une fiabilité et des développeurs. L'expérience a été grandement améliorée. Bien que l'ouverture soit terminée, Meta Llama 3 a été officiellement publié. la source de Laoxiangji n'est pas le code, les raisons derrière cela sont très réconfortantes. Google a annoncé une restructuration à grande échelle.
{{o.name}}
{{m.nom}}

Je suppose que tu aimes

Origine my.oschina.net/u/3869098/blog/11049507
conseillé
Classement