Python数据处理—电商婴幼儿用品分析!

跟着猴子学习数据分析第三关——数据处理,学习完朝阳医院药品销售情况分析后,又找到了阿里巴巴天池数据的婴儿用品销售数据进行分析,主要目的是熟悉数据清洗的流程并对进行数据分析。数据下载地址:https://tianchi.aliyun.com/dataset/dataDetail?dataId=45

此案例主要想了解以下情况:

1、有多少消费者购买了婴幼儿用品?

2、消费者中最多的买了多少?最少的买了多少?

3、平均每个用户购买多少?

一、观察数据

数据集是关于婴儿商品,包含有以下的数据字段:

商品表格字段:

user_id:用户身份信息

auction_id:购买行为编号

cat_id:商品种类序列号

cat1:根类别

property:商品属性

buy_mount:购买数量

day:购买时间。

二、按照数据分析的流程分析

1、导入数据:

Python数据处理—电商婴幼儿用品分析!

2、查看数据,数据类型、数据量、数据描述

Python数据处理—电商婴幼儿用品分析!

3、出去异常值、空值,发现阿里的数据很齐整,没有空数据、异常数据

加群:960410445  即可获取源码  以及教程!

Python数据处理—电商婴幼儿用品分析!

4、按销售的时间排序(升序),序列重新排序

Python数据处理—电商婴幼儿用品分析!

5、计算总的销售数量,消费者人数、平均每个消费者的购买数量

Python数据处理—电商婴幼儿用品分析!

6、结论:

婴幼儿用品销售中,总销售笔数是29971笔,最多的购买了10000,最少的购买了1,销售的总数量是76250,有29944位消费者购买了婴儿用品,平均每个消费者购买了2.5个。但是,最大值是10000,超出了平均值的4000倍,需要结合实际业务判断是不是异常值?

通过分析,发现此数据是一个很好的判断消费者行为的一个数据集,有很多的消费行为待挖掘,如每个大类每月销售多少?销费者平均多久买一次?等等。

猜你喜欢

转载自blog.csdn.net/qq_42156420/article/details/86289969