模板学堂|DataEase协助电商企业开展用户运营

DataEase开源数据可视化分析平台于2022年6月正式发布模板市场(https://dataease.io/templates/)。模板市场旨在为DataEase用户提供专业、美观、拿来即用的仪表板模板,方便用户根据自身的业务需求和使用场景选择对应的仪表板模板,并在优质模板的基础上轻松制作自己的仪表板。目前,DataEase模板市场的模板数量已经超过了100个。

2023年9月上新模板

DataEase模板市场定期进行模板上新。2023年9月共上新6个模板,涉及能源、交通、直播运营、地产运营等主题,欢迎大家在DataEase模板市场下载使用。

模板技巧

本月的模版技巧和大家分享一下如何使用DataEase开源数据可视化分析工具进行电商行业的用户运营分析。

一、数据来源

数据来源:https://tianchi.aliyun.com/dataset/649 (阿里天池数据集:淘宝用户行为数据)

1. 字段定义

2. 用户行为类型定义

二、数据清洗

1. 列名的重命名

将获取的原数据导入到数据库中生成数据集时,原数据集中不包含表头。因此需要为列名进行重命名操作。

ALTER TABLE userbehavior CHANGE COLUMN `1` user_id VARCHAR(255);
ALTER TABLE userbehavior CHANGE COLUMN `2268318` item_id VARCHAR(255); 
ALTER TABLE userbehavior CHANGE COLUMN `2520377` cat_id VARCHAR(255); 
ALTER TABLE userbehavior CHANGE COLUMN pv behavior_type VARCHAR(255); 
ALTER TABLE userbehavior CHANGE COLUMN `1511544070` time_stamp VARCHAR(255);

2. 重复值与缺失值检验

导入数据后,需要先检查数据集中是否包含重复值或是否有缺失值。

# 重复值检验 
SELECT * 
FROM userbehavior 
GROUP BY user_id,item_id,cat_id,time_stamp 
HAVING COUNT(*)>1; 
# 缺失值检查 
SELECT   COUNT(user_id) AS 用户数量
         ,COUNT(item_id) AS 商品数量
         ,COUNT(cat_id) AS 商品类目数量
         ,COUNT(behavior_type) AS 用户行为数量
         ,COUNT(time_stamp) AS 时间戳数量
FROM userbehavior;

根据查询结果,数据集中并不包含重复值,也不存在缺失值。

3. 时间戳格式化

需要将原数据集中的时间戳格式转换为日期的时间格式,以便后续分析处理。

# 新增日期列 
ALTER TABLE userbehavior ADD COLUMN `date` VARCHAR(255); 
UPDATE userbehavior SET `date`=FROM_UNIXTIME(time_stamp,'%Y-%m-%d'); 


# 新增时间列 
ALTER TABLE userbehavior ADD COLUMN `time` VARCHAR(255); 
UPDATE userbehavior SET `time`=FROM_UNIXTIME(time_stamp,'%H:%i:%s'); 


# 新增小时列 
ALTER TABLE userbehavior ADD COLUMN `hour` VARCHAR(255); 
UPDATE userbehavior SET `hour`=hour(time);

三、数据分析

1. 用户访问分析

1)数据预处理

将新建的SQL数据集导入DataEase后,在DataEase的数据集“字段管理”页面可以看到各字段均为初始的“文本”类型,需要数据集创建者自行将字段修改为合适的字段类型。如下图所示,将“date”和“time”修改为对应的时间格式,将“user_id”和“item_id”转换为维度。

2)视图设计

在DataEase中新建仪表板。选择刚创建的数据集userbehavior,在仪表板中新建名为“用户访问分析”的组合图。如下图所示,在仪表板制作页面右侧编辑栏的空白框中拖入对应字段并进行修改。

视图中需要展示的指标及其含义为:

 UV(Unique Visitor):即独立访客。访问某网站的1台电脑客户端即为1个独立访客;

 PV(Page View):即页面浏览量,或点击量。用户每1次对网站中的每个网页访问均被记录1次。

具体操作步骤如下:

① 将字段“data”拖入“类别轴/维度”空白框中,并设置排序为“升序”;

② 将字段“user_id”拖入“主轴值/指标”空白框中,设置汇总方式为“计数”,并将显示名改为“PV”;

③ 将字段“user_id”拖入“副轴值/指标”空白框中,选择汇总方式为“去重计数”,并将显示名改为“UV”;

④ 将字段“date”和字段“hour”按顺序拖入“钻取/维度”空白框中。

3)分析结果

配置视图下钻后,点击视图中想要查看的数据点,视图将根据下钻结果跳转至该日期的具体时段数据,以便于观看者查看“UV”和“PV”两项指标的当日数据趋势变化。

从折线图中可以看出:11月25日至12月1日的PV和UV数据波动相对稳定,12月2日至12月3日的PV、UV数据曲线则有明显增幅。其中11月25至26日和12月2至3日均为周末,但11月25、26日和工作日的PV、UV数据相近,而12月2日至3日却有明显增幅。

2. 用户留存分析

1)数据预处理

① 设定自11月25日起新登录的用户为新增用户,查询每位新增用户第一次登录的日期;

# 创建视图,查询用户第一次登录的日期 
CREATE VIEW first_log 
AS 
SELECT user_id,MIN(date) first_logday 
FROM userbehaviorGROUP BY user_id;

数据预览如下:

② 查询每日新增用户数;

SELECT first_logday,COUNT(user_id) 日新增用户 
FROM first_log 
GROUP BY first_logday 
ORDER BY first_logday;

数据预览如下:

③ 创建视图,查询用户登录当天与第一次登录的间隔天数;

# 创建视图,查询用户登录当天与第一次登录间隔天数 
CREATE VIEW day_diffAS 
SELECT a.user_id,b.first_logday, 
DATEDIFF(a.date,first_logday) day_diff 
FROM userbehavior a 
INNER JOIN first_log b 
ON a.user_id=b.user_id 
GROUP BY a.user_id,a.date;

数据预览如下:

④ 在DataEase中新建SQL数据集,查询不同登录日期的用户每日留存统计。

SELECT first_logday, 
SUM(CASE day_diff WHEN 0 THEN 1 ELSE 0 END) day_0, 
SUM(CASE day_diff WHEN 1 THEN 1 ELSE 0 END) day_1, 
SUM(CASE day_diff WHEN 2 THEN 1 ELSE 0 END) day_2, 
SUM(CASE day_diff WHEN 3 THEN 1 ELSE 0 END) day_3, 
SUM(CASE day_diff WHEN 4 THEN 1 ELSE 0 END) day_4, 
SUM(CASE day_diff WHEN 5 THEN 1 ELSE 0 END) day_5, 
SUM(CASE day_diff WHEN 6 THEN 1 ELSE 0 END) day_6, 
SUM(CASE day_diff WHEN 7 THEN 1 ELSE 0 END) day_7, 
SUM(CASE day_diff WHEN 8 THEN 1 ELSE 0 END) day_8 
FROM day_diff 
GROUP BY first_logday 
ORDER BY first_logday;

2)视图设计

在仪表板中新建“明细表”视图,选择刚创建的用户每日留存统计SQL数据集,并按下图所示将各字段拖入“数据列/维度或指标”空白框中。

3)分析结果

在11月25日至30日之间首日登录的用户,在12月2日之前每日的留存率在50%-80%之间浮动;而在12月2日至3日不同批次的用户留存率均有大幅提升(超过90%),可能是由于平台或店铺推出了促销活动,或者每日打卡积分活动等提升了用户活跃度与留存率。

3. 用户复购分析

1)数据预处理

① 在DataEase中新建SQL数据集,查询用户的购买次数;

# 查询用户的购买次数 
SELECT user_id,COUNT(user_id) AS 购买次数 
FROM userbehavior 
WHERE behavior_type='buy' 
GROUP BY user_id 
ORDER BY 购买次数 DESC;

② 选择“字段管理”→“新建计算字段”,对购买频次做数据映射;

 字段名称:用户分层

 字段表达式,具体如下图所示:

CASE WHEN [购买次数] >=1 AND [购买次数] <= 4 THEN '1-4' 
WHEN [购买次数] >=5 AND [购买次数] <= 9 THEN '5-9' 
WHEN [购买次数] >=10 AND [购买次数] <= 14 THEN '10-14' 
WHEN [购买次数] >=15 AND [购买次数] <= 19 THEN '15-19' 
WHEN [购买次数] >=20 AND [购买次数] <= 24 THEN '20-24' 
WHEN [购买次数] >=25 AND [购买次数] <= 29 THEN '25-29' 
ELSE '>30' 
END

数据预览如下:

2)视图设计

在仪表板中新建“基础柱状图”视图,选择刚创建的用户购买次数数据集。如下图所示,在“仪表板制作”页面右侧的编辑栏中将对应的字段拖入空白框并做修改。

① 将新建的“用户分层”字段拖入“类别轴/维度”空白框中;

② 将“购买次数”字段拖入“值轴/指标”空白框中,选择汇总方式为“求和”;

③ 将“记录数”字段拖入“值轴/指标”空白框中,选择汇总方式为“计数”,并将显示名修改为“购买人数”。

3)分析结果

有超过66%的用户发生过复购行为,但多数用户复购次数不超过5次,商家在提升用户复购意愿方面仍有进步空间。

4. 用户转化分析

1)视图设计

新建“漏斗图”视图,选择userbehavior数据集。如下图所示,将对应字段拖入到“仪表板制作”页面右侧编辑栏的空白框中。

① 将“behavior_type”字段拖入“漏斗分层/维度”空白框中,并将显示名修改为“行为类型”;

② 将“user_id”字段拖入“漏斗层宽/指标”中,选择汇总方式为“计数”,并将显示名修改为“用户数”。

2)分析结果

从漏斗图中可知,从“点击”到“收藏”的路径中用户流失较多,而“添加购物车”到“购买”的路径中用户流失极少。

总结

随着“社交电商”、“直播电商”等一次次的电商转型升级,电商平台不仅为企业提供了全新的商业模式,也为消费者带来了更为便捷和多样化的购物体验。然而,随着电商市场竞争的日益激烈,“如何更好地进行用户运营,满足用户需求,提升用户忠诚度”,就成为了电商企业亟需解决的关键问题之一。

数据分析与数据可视化作为强有力的工具,为电商企业开展用户运营提供了深入洞察消费者行为、趋势和偏好的途径。通过DataEase开源数据可视化分析工具进行仪表板制作与展示,电商企业可以对用户数据进行更为全面的分析,并且更准确地了解用户的购物习惯、兴趣爱好,甚至是情感态度。这些数据及其可视化视图不仅有助于企业优化产品和服务,更为重要的是,可以帮助电商企业制定精准的用户运营策略,从而更好地吸引、留存和发展用户群体。

雷军:小米全新操作系统澎湃 OS 正式版已完成封包 国美 App 抽奖页面弹窗辱骂其创始人 Ubuntu 23.10 正式发布,不妨趁周五升级一波! Ubuntu 23.10 发版插曲:因包含仇恨言论,ISO 镜像被紧急“召回” 23 岁博士生修复 Firefox 中的 22 年“幽灵老 Bug” RustDesk 远程桌面 1.2.3 发布,增强 Wayland 支持 TiDB 7.4 发版:正式兼容 MySQL 8.0 拔出罗技 USB 接收器后,Linux 内核竟然崩溃了 大神用 Scratch 手搓 RISC-V 模拟器,成功运行 Linux 内核 JetBrains 推出 Writerside,创建技术文档的工具
{{o.name}}
{{m.name}}

猜你喜欢

转载自my.oschina.net/u/4736111/blog/10119802