1. But de l'analyse: effectuer une analyse des données basée sur les données des transactions de commerce électronique passées pour découvrir les lois et les problèmes pour guider les entreprises
2. Données
Importer une bibliothèque
Importer des données
Après le chargement des données, la première étape consiste à utiliser les méthodes decrire et info pour voir la distribution approximative des données
Charger device_type
3. Nettoyage des données
numéro de commande
orderId est la seule valeur d'un système
Voyons s'il y a des valeurs en double
S'il y a des valeurs en double, elles sont généralement traitées en dernier, car d'autres colonnes peuvent affecter les enregistrements en double qui sont supprimés
Traitez d'abord les autres colonnes
identifiant d'utilisateur
Le userId a seulement besoin de voir si la valeur est dans la plage normale de la description et des informations ci-dessus
Pour les données de commande, un utilisateur peut avoir plusieurs commandes et les valeurs en double sont raisonnables
productId
La valeur minimale de productId est 0, regardez d'abord le nombre d'enregistrements avec une valeur de 0
177 enregistrements, le nombre n'est pas important, cela peut être dû au fait que les marchandises sont mises sur les étagères, supprimez ces enregistrements lorsque d'autres valeurs sont traitées
cityId
cityId est similaire à userId, les valeurs sont dans la plage normale, pas besoin de traiter
le prix n'a pas de valeur nulle, et tous sont supérieurs à 0, faites attention à l'unité est d'une minute, transformez-le en yuan
payMoney
payMoney a une valeur négative, et passer une commande ne peut pas être une valeur négative, donc ici l'enregistrement des valeurs négatives doit être supprimé
Supprimer les enregistrements avec des valeurs négatives
Les unités deviennent yuan
Identifiant de la chaine
channelId Selon le résultat des informations, certaines données nulles peuvent être des bogues courts et pour d'autres raisons, le champ channelId n'a pas été transmis lors de la commande
Lorsque la quantité de données est importante, la suppression d'un petit nombre d'enregistrements nuls n'affectera pas les résultats statistiques. Supprimez directement ici
La valeur de deviceType est visible dans le fichier device_type.txt, pas de problème, pas besoin de gérer
Ni createTime ni payTime ne sont nuls, mais nous devons compter les données 2016, nous devons donc supprimer les données non 2016
Revenez en arrière et supprimez les enregistrements en double de orderId
Supprimer le produitId vaut 0
Après le nettoyage des données, lancez l'analyse
4. Traitement et analyse des données
Premier regard sur la situation globale des données
Le nombre total de commandes, le nombre total d'utilisateurs de commandes, le total des ventes, le nombre de produits avec chiffre d'affaires
L'analyse des données peut être considérée sous deux aspects, l'un est la dimension, l'autre est l'indicateur, la dimension peut être considérée comme l'axe x et l'indicateur peut être considéré comme l'axe y.
Réduction dimensionnelle
Par productId
Jetons un coup d'œil aux dix et dix dernières ventes de produits
Ventes
Regardez l'intersection des ventes et des ventes des 100 derniers, si les ventes et les ventes ne sont pas bonnes, ces produits doivent voir s'ils veulent optimiser ou supprimer
prix
Pour le prix, vous pouvez regarder la distribution des prix de tous les produits, afin que vous puissiez savoir quels prix des produits se vendent le mieux
Il n'y a pas de produits dans de nombreuses gammes de prix. Si vous avez des données de concurrents, vous pouvez voir si vous devez remplir les produits.
Prix correspondant
Analyse du temps de commande
La distribution de la quantité de commande par heure peut être favorisée par le temps
Il y a plus de commandes à 12h, 13h et 14h, ce qui devrait être pendant la pause déjeuner, puis vers 20h.
Selon la semaine, la plupart des commandes sont passées le samedi, suivies du vendredi et du dimanche
Combien de temps après le paiement de la commande
La plupart du paiement est effectué en dix minutes, ce qui indique que les utilisateurs hésitent rarement et que le but de l'achat est très fort
Chiffre d'affaires mensuel