Tableau 优课堂 | 第82课:Tableau Prep 聚合步骤

published: 2024-04-02

欢迎观看由优阅达制作的【优课堂】系列视频。本节课,我们来学习: Tableau Prep 聚合步骤。


聚合步骤简介

Tableau Prep 中的聚合步骤,用于更改数据的详细级别,因此它的粒度更小,通常是为了在更高聚合级别中与其他数据合并做准备。

有关什么是聚合,以及为什么它是准备数据必要部分的更多信息,请点击查看 :Tableau 优课堂 | 第76课:Tableau Prep 界面

在本期优课堂使用的数据示例(超市订单集)中,有一张表是以 Order ID 字段为主键的销售额数据表。其中,一行记录代表一个订单,即一次交易行为。

还有一张表,是记录各类别产品利润的数据表。

如果将这 2 个数据表联接起来,就可以得到各类别产品的销售额和利润。

然而,我们想要的是:在类别利润表中添加订单的销售额。那么,订单数据应该与类别表中的每行数据的粒度保持一致

以上需求如何实现呢?我们需要将订单表数据聚合为类别级别的数据。


操作演示:如何聚合?

首先,需要在流程中添加一个聚合步骤。单击“销售额”表后面的“+”号并选择“聚合”。聚合窗格将在下面打开,以便进行配置操作。

在左侧,是这个数据源中所有的字段列表。在右侧,有两个拖放区域,一个用于分组字段,另一个用于聚合字段。

为了使字段“从聚合步骤的另一端出来”,必须对其进行分组或聚合。

分组字段决定行的粒度。如果希望聚合后的数据是每个日期售出的产品类型金额,则需按照“订单日期”和“产品类型”字段进行分组。如果希望聚合后的数据仅仅是每个售出类别的销售额,就只需要按“产品类型”进行分组。

无论希望将哪个字段聚合到分组字段的级别,此字段都将被放置在“聚合字段”区域,并设置它们的聚合操作集。在本例中,选择要聚合的字段(即销售额),我们可轻易得出:每日每个产品类型的销售额。

接下来,把字段“Order ID”拖到“聚合字段”区域。作为一个数值类型的字段,Order ID 默认的聚合类型是“总和”,但在这里“总和”没有意义,合理的聚合类型是“计数”。

因此,我们可以通过单击 “总和” 所在位置并从下拉菜单中选择“计数”来将其更改为想要的聚合类型。

要查看这一步的结果,可以通过添加一个“清理步骤”来查看数据的概要窗格。

在概要窗格的工具栏中看到,共有 4 个字段和 2276 行。这些字段分别是 “订单日期”、“产品类型”、“销售额”和“Order ID(计数)”,因为它们是唯一被放置到聚合窗格中的字段。

为了更直观看到效果,需对其进行重命名。将 “Order ID” 重命名为 “订单数量”。


操作演示:修改聚合配置

如果想保留更多的原始字段(如产品子类),可以返回到“聚合步骤”并将它们添加到“分组字段”区域。当重新回到“清理步骤”时,可以看到聚合后的表变成5个字段3489行,因为新增加了“产品子类”字段,导致聚合表的数据粒度更细,行数增加。


操作演示:联接聚合表

撤回这一步操作,回到原来的 4 个字段,即 2276 行。我们可以看到,数据现在已经完全聚合到所需的详细级别,可以继续准备过程中的下一步,例如将其与“利润”表的数据联接起来。



以上就是关于「Tableau Prep 聚合步骤」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请持续关注优阅达大数据生态。


更多相关信息,请访问专题页: Tableau使用入门教程