Analyse des données de transaction e-commerce

1. But de l'analyse: effectuer une analyse des données basée sur les données des transactions de commerce électronique passées pour découvrir les lois et les problèmes pour guider les entreprises

2. Données

Importer une bibliothèque

 Importer des données

 Après le chargement des données, la première étape consiste à utiliser les méthodes decrire et info pour voir la distribution approximative des données

 Charger device_type

 

3. Nettoyage des données

numéro de commande

orderId est la seule valeur d'un système

Voyons s'il y a des valeurs en double

S'il y a des valeurs en double, elles sont généralement traitées en dernier, car d'autres colonnes peuvent affecter les enregistrements en double qui sont supprimés

Traitez d'abord les autres colonnes

identifiant d'utilisateur

Le userId a seulement besoin de voir si la valeur est dans la plage normale de la description et des informations ci-dessus

Pour les données de commande, un utilisateur peut avoir plusieurs commandes et les valeurs en double sont raisonnables

productId

La valeur minimale de productId est 0, regardez d'abord le nombre d'enregistrements avec une valeur de 0

177 enregistrements, le nombre n'est pas important, cela peut être dû au fait que les marchandises sont mises sur les étagères, supprimez ces enregistrements lorsque d'autres valeurs sont traitées

cityId

cityId est similaire à userId, les valeurs sont dans la plage normale, pas besoin de traiter

le prix n'a pas de valeur nulle, et tous sont supérieurs à 0, faites attention à l'unité est d'une minute, transformez-le en yuan

payMoney

payMoney a une valeur négative, et passer une commande ne peut pas être une valeur négative, donc ici l'enregistrement des valeurs négatives doit être supprimé

Supprimer les enregistrements avec des valeurs négatives

 Les unités deviennent yuan

Identifiant de la chaine

channelId Selon le résultat des informations, certaines données nulles peuvent être des bogues courts et pour d'autres raisons, le champ channelId n'a pas été transmis lors de la commande

Lorsque la quantité de données est importante, la suppression d'un petit nombre d'enregistrements nuls n'affectera pas les résultats statistiques. Supprimez directement ici

La valeur de deviceType est visible dans le fichier device_type.txt, pas de problème, pas besoin de gérer

Ni createTime ni payTime ne sont nuls, mais nous devons compter les données 2016, nous devons donc supprimer les données non 2016

Revenez en arrière et supprimez les enregistrements en double de orderId

Supprimer le produitId vaut 0

Après le nettoyage des données, lancez l'analyse

 

4. Traitement et analyse des données

Premier regard sur la situation globale des données

Le nombre total de commandes, le nombre total d'utilisateurs de commandes, le total des ventes, le nombre de produits avec chiffre d'affaires

L'analyse des données peut être considérée sous deux aspects, l'un est la dimension, l'autre est l'indicateur, la dimension peut être considérée comme l'axe x et l'indicateur peut être considéré comme l'axe y.

Réduction dimensionnelle

Par productId

Jetons un coup d'œil aux dix et dix dernières ventes de produits

Ventes

Regardez l'intersection des ventes et des ventes des 100 derniers, si les ventes et les ventes ne sont pas bonnes, ces produits doivent voir s'ils veulent optimiser ou supprimer

prix

Pour le prix, vous pouvez regarder la distribution des prix de tous les produits, afin que vous puissiez savoir quels prix des produits se vendent le mieux

 

Il n'y a pas de produits dans de nombreuses gammes de prix. Si vous avez des données de concurrents, vous pouvez voir si vous devez remplir les produits.

Prix ​​correspondant

Analyse du temps de commande

La distribution de la quantité de commande par heure peut être favorisée par le temps

Il y a plus de commandes à 12h, 13h et 14h, ce qui devrait être pendant la pause déjeuner, puis vers 20h.

Selon la semaine, la plupart des commandes sont passées le samedi, suivies du vendredi et du dimanche

Combien de temps après le paiement de la commande

La plupart du paiement est effectué en dix minutes, ce qui indique que les utilisateurs hésitent rarement et que le but de l'achat est très fort

Chiffre d'affaires mensuel

 

Je suppose que tu aimes

Origine www.cnblogs.com/daisyxxx/p/12683760.html
conseillé
Classement