从零开始Tableau | 7.集

 

在tableau中,“集”是根据某些条件定义数据子集的自定义字段,可以理解为维度字段的部分成员。本节记录要点:

  • 集的创建
  • 集的合并

集的创建

集可以分为两类,分别是常量集、计算集。

  • 常量集:常量集属于静态集,其成员是固定的,不会根据数据变化而变化。常量集可以基于单个维度或多个维度创建。
  • 计算集:计算集可基于计算条件建立,创建后会根据数据动态变化。计算集只能基于单个维度进行创建。

创建常量集

这里使用“超市”数据源中的客户销售额及利润率数据,创建“高销售额客户”常量集。

Step01 建立客户销售额和利润率的散点图,为了让散点图看起来更清晰,首先将左下角偏离度最大的数据点排除视图。

图:建立散点图示例
图:建立散点图示例

Step02 直接在视图区选中高销售额相对较高的数据点,通过右键菜单执行“创建集”操作。

图:常量集创建操作示例
图:常量集创建操作示例

Step03 在弹出的“创建集”对话框中,根据需要设置各项内容,完成常量集创建。

  • ① “名称”,在此处将集命名为“高销售额客户”。
  • ②“排除”,就是对选中的数据点进行反选,反选后,“集”将包含没有被选中的其他成员,而之前被选中的成员将被排除。
  • ③“添加到筛选器功能区”,就是将该集作为筛选结果,移动到筛选器区。
图:常量集创建窗口示例
图:常量集创建窗口示例

创建计算集

使用“超市”数据源中的客户销售额及利润率数据,创建“销售额超过40000元客户”、“利润率排名前100位客户”两个计算集。

创建“销售额超过40000元客户”集

Step01 在数据窗口的维度区域,找到“客户名称”字段,通过右键菜单执行“集”操作。

图:创建计算集操作
图:创建计算集操作

Step02 在弹出的“创建集”对话框中,根据需要设置好相关内容,完成“销售额超过40000元客户”计算集创建。

  • ① 在常规、条件、顶部三栏中,选择“条件”选项卡。
  • ② 在“按字段”区域中,选择用于计算的字段“销售额”,并将聚合方式设为“总和”,同时将条件设置大于40000元。
  • ③ 在“名称”位置,将该计算字段重命名为“销售额超过40000元客户”。
图:创建销售额计算集示例
图:创建销售额计算集示例

3.将创建好的“销售额超过40000元客户”计算集拖到“标记”卡中的“颜色”,视图中就会将销售额超过140000元及未超过40000元的客户分为两组,一组体现为蓝色,一组体现为灰色。

图:创建销售额计算集结果示例
图:创建销售额计算集结果示例

创建“利润率TOP100客户”集

Step01 在数据窗口的维度区域,找到“客户名称”字段,通过右键菜单执行“集”操作。

Step02 在弹出的“创建集”对话框中,根据需要设置好相关内容,完成“利润TOP10客户”计算集创建。

  • ① 在常规、条件、顶部三栏中,选择“顶部”选项卡。
  • ② 在“按字段”区域中,选择“顶部”和“100”,表示取前100位客户,同时选择“利润率”,表示利润值作为排序依据。
  • ③ 在“名称”位置,将该计算字段重命名为“利润率TOP100客户”。
1535900341463
图:创建利润率计算集示例

Step03 将创建好的“利润率TOP100客户”计算集拖到“标记”卡中的“颜色”,视图中就会将“利润率TOP100客户”及100位以后的客户分为两组,一组体现为蓝色,一组体现为灰色。

图:创建利润率计算集结果示例
图:创建利润率计算集结果示例

集的合并

集与集之间可以进行合并,从而对集内的成员进一步比较和筛选。集的合并分为三种情况,分别是并集、交集和差集。

两个集要进行合并,必须具有相同的维度。比如,“销售额超过40000元客户”与“利润率TOP100客户”两个集都是基于客户维度,这两个集客进行合并,但是不能将这两个集与“销售额前10位产品”进行合并,因为后者是基于产品维度,与前两个集的维度不同。

并集

并集包含两个集中的所有成员。

创建“销售额超过40000元客户”与“利润率TOP100客户”的并集。在其中一个集字段上通过鼠标右键弹出“创建集”窗口,根据需要设置好相应内容,即可完成并集的创建。

  • ① 选择需要创建并集的两个集字段,分别为“销售额超过40000元客户”与“利润率TOP100客户”。
  • ② 选择集的合并方式为“两个集中的所有成员”。
  • ③ 将该集名称重命名为“并集”。
图:创建"并集"示例
图:创建"并集"示例

将创建好的“并集”字段拖到“标记”卡中的“颜色”,视图中就会将“销售额超过40000元客户”与“利润率TOP100客户”全部标记为蓝色,其余客户标记为灰色。

图:"并集"创建结果示例
图:"并集"创建结果示例

交集

交集将包含两个集内均存在的成员。

创建“销售额超过40000元客户”与“利润率TOP100客户”的交集。在其中一个集字段上通过鼠标右键弹出“创建集”窗口,根据需要设置好相应内容,即可完成并集的创建。

  • ① 选择需要创建交集的两个集字段,分别为“销售额超过40000元客户”与“利润率TOP100客户”。
  • ② 选择集的合并方式为“两个集中的共享成员”。
  • ③ 将该集名称重命名为“交集”。
图:创建"交集"示例
图:创建"交集"示例

将创建好的“交集”字段拖到“标记”卡中的“颜色”,视图中就会将既是“销售额超过40000元客户”,又是“利润率TOP100客户”筛选出来,并标记为蓝色,其余客户标记为灰色。

图:"交集"创建结果示例
图:"交集"创建结果示例

差集

差集包含指定集内存在而第二个集内不存在的所有成员,即排除共享成员。

创建“销售额超过40000元客户”与“利润率TOP100客户”的差集,即在“销售额超过40000元客户”集中,排除与“利润率TOP100客户”集共享的成员。

在“销售额超过40000元客户”集字段上通过鼠标右键弹出“创建集”窗口,根据需要设置好相应内容,即可完成左差集的创建。

  • ① 选择需要创建差集的两个集字段,左边为“销售额超过40000元客户”,右边为“利润率TOP100客户”。
  • ② 选择集的合并方式为:“销售额超过40000元客户”排除共享成员。
  • ③ 将该集名称重命名为“销售额差集”。
图:创建"销售额差集"示例
图:创建"销售额差集"示例

将创建好的“销售额差集”字段拖到“标记”卡中的“颜色”,视图中就会将销售额超过40000元客户中,利润率不在前100位的客户筛选出来,并标记为蓝色,其余客户标记为灰色。

图:"销售额差集"创建结果示例
图:"销售额差集"创建结果示例

创建“利润率TOP100客户”与“销售额超过40000元客户”的差集,即在“利润率TOP100客户”集中,排除与“销售额超过40000元客户”集共享的成员。

在“销售额超过40000元客户”集字段上通过鼠标右键弹出“创建集”窗口,根据需要设置好相应内容,即可完成左差集的创建。

  • ① 选择需要创建差集的两个集字段,左边为“销售额超过40000元客户”,右边为“利润率TOP100客户”。
  • ② 选择集的合并方式为:“利润率TOP100客户”排除共享成员。
  • ③ 将该集名称重命名为“利润率差集”。
1535909995116
图:创建"利润率差集"示例

将创建好的“利润率差集”字段拖到“标记”卡中的“颜色”,视图中就会将利润率排前100位,但销售额未超过40000元的客户筛选出来,并标记为蓝色,其余客户标记为灰色。

图:"利润率差集"创建结果示例
图:"利润率差集"创建结果示例

猜你喜欢

转载自blog.csdn.net/springyang2015/article/details/82491011