数据可视化——向木东居士学习 第二期

【数据科学家学习小组】之数据可视化(第二期)

本系列文章主要目的有两个:

  1. 从数据可视化的角度出发,总结一下现在无论是数据可视化还是报表开发、BI开发的工具和思路
  2. 从木东居士的学习小组学习到一些大厂的工作学习思路,让自己思考的更全面更成熟,完成的文档也更加全面、漂亮。

学习内容

「时序数据」和「比例数据」的可视化

  • 了解时序数据的特点,熟练掌握不同类型的时序数据分别适合的图表类型;
  • 了解比例型数据可视化的目的,学会根据数据集的特征去选择合适的图表;
  • 实践:从给定的4个数据集中挑选两个,自行选择合适图表并进行可视化呈现

知识总结

时序数据:

  1. 离散时间点(少周期):柱状图、并列柱状图、堆叠柱状图、百分比堆叠柱状图等
    • 重点突出:数据构成不要太多
    • 分类占比变化:使用百分比堆叠柱状图
    • 对比明显:数据条数不要太多
  2. 连续时间点(多周期):折线图、面积图、堆叠面积图、瀑布图(阶梯图)、拟合曲线图等
    • 点线图:数据项不超过12个
    • 折线图:当数据集中的数据项比较多,大于12条时,采用点线图,会让整条线上的点很密集,影响看数据的趋势,此时采用折线图是不错的选择
    • 曲线图:相邻节点的连线更加平滑,更能体现趋势变化
    • 阶梯图:某两个相邻的时间节点,后一个节点的数据相对于前一个节点数据的升降变化,常用于商品价格变动、股票价格波动、税率变化等场景中。
      • 前一时间节点数值;
      • 当前时间节点数值;
      • 当前节点较前一节点的差值;

比例数据:

  1. 不含时间属性:饼图、环形图、嵌套的饼图、矩形树图;

    • 饼图

      当构成整体的数据项较少时,采用饼图是一种不错的选择。建议扇区个数最大值在5~7个之间。当数据项超过一定数量时,可以按照占比,把排名最末的几项归位「其他」

    • 环形图

      饼图通过各扇区角度去映射各分类项对应的数值,「环形图」则通过各弧形的长度来衡量数值。

    • 矩形树图

      矩形树图,是一种基于面积的可视化方法。外部矩形代表父级类别,内部矩形代表子类别。相比于其他表示比例型的数据,矩形树图更适合展示具有树状结构的数据。

  2. 含时间属性:百分比堆叠柱状图、百分比堆叠面积图;

完成作业

  • 场景1:某电商公司2018年销售额趋势

场景1提供的数据是一个汇总数据,从数据粒度的角度看来,每行数据所表达的信息并不明确,所以需要预先做好数据处理工作,将每行数据变成月度销售额数据,度量是销售额,维度是商品分类。

最终使用堆叠柱状图表示了销售额总值的变化,用颜色区分了不同的商品分类(每月的总值趋势线没有成功添加上)

  • 场景2:某只股票在2019年10月份的价格变动

这个数据直接使用阶梯图(瀑布图或蜡烛图),注意使用tableau中的颜色和大小选项来控制图形的颜色和柱大小

  • 场景3:某快递公司每天寄件单的揽收时效分布

直接使用矩形树图

  • 场景4:主流快递公司承运量流向分布

    场景4比较复杂,严格意义上说需要用两个图,但是如果只要数量不看占比的话一个图也是可以做到的

作图之前也是进行了一些数据处理工作

最终使用tableau制作的看板如下

参考文章

  1. 如何优雅地选择数据图表:时序数据和比例型数据!
  2. 《鲜活的数据》 第4章p73和第5章p111
  3. 【数据科学家学习小组】之数据可视化(第一期)第二周
发布了34 篇原创文章 · 获赞 13 · 访问量 5万+

猜你喜欢

转载自blog.csdn.net/frone/article/details/103184186