Tableau 优课堂 | 第76课:Tableau Prep 界面

published: 2023-12-19

欢迎观看由优阅达制作的【优课堂】系列视频。本节课,我们来学习: Tableau Prep 界面。


Tableau Prep 界面总览

Tableau Prep 可让你自助式地清理、聚合和组合数据,从而为分析做准备。打开 Tableau Prep 时,会出现一个开始界面。

右侧是“探索”窗格,包含培训和相关资源推荐;中间部分,会出现最近的流程文件和示例流程;左侧是“连接”窗格,可以从“连接”窗格中选择数据源并将表拖出。

我们点击“+”按钮来连接数据源,数据表将被加载到连接窗格。

拖动数据表到空白画布(流程窗格)中,是创建流程中的第一步,即输入步骤。每个流程都必须从输入步骤开始,一个流程中可有多个输入步骤。

当在流程窗格中选择一个步骤时,它的相关窗格将在下面打开。比如,我们可以通过选择引入单个表或创建通配符并集来配置输入。如果数据源足够大到需要进行抽样,还可以配置抽样。

在右边,可以看到数据中的字段,并可以选择将哪些字段带入 Tableau Prep。还可以在此设置筛选器,限制将哪些数据带入流程的其他部分。

要添加另一个步骤,只需单击流程中前一步的加号,而后可以从清理步骤、聚合、转置、并集、联接或输出等步骤中进行选择。

在流程中,清理步骤作为一个简单的条出现。

下面是“概要”窗格,它以卡片的形式显示数据中的字段。每张卡片显示该字段中的值和每个值的行数,从而深入了解数据中的结构和关系。

清理操作可以在每张卡片的下拉菜单或上下文工具栏中找到。我们还可以通过直接交互进行一些清理,例如更改数据类型或重命名字段。

执行每种类型的清理操作,都将作为流程窗格中清理步骤上方的注释出现,并可以在左侧的更改中进行跟踪。

“概要”窗格下面是数据网格,它将显示数据行,类似于电子表格视图。


其他常用的步骤类型介绍

现在,打开一个更复杂的流程,看看在 Tableau Prep 中还可以做什么步骤。

我们可以把它分解成几个部分:

  • 第一部分,通过一系列的并集操作合并了四年的海外超市数据

  • 第二部分,联接产品类别数据并清洗。

  • 第三部分,引入成本信息,引入前需要对成本数据转置清洗

  • 最后,通过聚合操作,把汇率联接进来,数据源完成清洗后生成输出。

Tableau Prep 流程中的常用步骤类型都在这里得以呈现。单击流程的任意部分,可以打开与该步骤相关的窗格。

接下来,让我们分别学习Tableau Prep 中各种常用的数据处理步骤界面。


01 转置步骤简介

转置步骤的图标显示为“从列到行”样式。当我们在流程中选中图标样式,转置步骤的详细信息立刻显示在下方窗口中。

可以看到:字段名称显示在左侧列表中,转置字段的内容显示在“转置的字段”区域,字段转置后的结果显示在右侧,同时包含了“概要窗格”视图和“数据网格”视图。


02 聚合步骤简介

聚合步骤由流程中的 ∑(Sigma) 符号来表示。当单击一个聚合步骤时,字段再次显示在下方窗格的左侧,并被带到分组字段或聚合字段区域,这取决于所需聚合的维度和聚合的度量。


03 并集与联接步骤简介

在 Tableau Prep 中,我们可将“并集步骤”理解为:使用相同的列结构来添加更多行。

当选中一个并集步骤图标,可以看到:左侧显示了并集步骤的数据源输入。

在右侧,我们看到数据源并集结果的“概要窗格”和“数据网格”视图。在“概要窗格”中,每个字段的卡片显示一个彩色堆叠条,显示该字段中存在哪些数据输入。

如果需要合并字段,只需点击某字段卡片,将其拖拽到另一个字段卡片上即可。

并集步骤还自动生成了一个“Table Names”列,其中包含关于每行来自哪个数据源的信息。

联接是另一种合并数据的方法,可以理解为向现有数据行添加新列。在 Tableau Prep 中,联接步骤为配置数据联接提供了一个可视化窗口。

在联接窗格的最左侧,我们可以创建一个或多个联接子句,只需简单选择要以哪些字段进行联接以及如何联接。

此外,还可通过单击关系图来选择联接类型。

在联接类型下,可以看到结果摘要,显示匹配的内容(包括在结果中)或不匹配的内容(排除在结果中)。如果更改联接类型,就会看到更新后的结果摘要。

联接设置区域的右侧,提供了联接效果预览。我们可以看到联接子句的细分,红色值是不匹配的,黑色值是匹配的。

在联接步骤窗格的最右边,可以看到联接结果的“概要窗格”和“数据网格”视图。

请注意:通过上面的学习,我们了解到合并数据可以通过“并集”或“联接”两种方式来完成。


04 输出步骤简介

数据被清理成形并组合到我们满意的程度后,就必须输出数据。在 Tableau Prep 中,可将数据处理流程保存为流程文件(.tfl)),或者打包的流程文件(.tflx)。

请注意,保存为流程文件(.tfl))格式,将保存流程本身,而不是生成数据输出。而打包的流程文件(.tflx)包括了流程本身和数据提取,同样不是已完成清理的数据输出。

因此,要创建完成的数据源,必须将“输出步骤”添加到流程中,然后运行流程。

单击一个输出步骤,打开下方窗格。其中,右侧的数据网格预览用于显示已完成清理的数据。

在左侧,我们可以配置输出。它既可以保存到文件中,也可以作为数据源发布,也可以发布到数据库。可以命名文件、设置输出类型是 .hyper 提取、Excel 还是 csv 格式,还可以指定文件的保存位置。

最后,单击“运行流程”,Tableau Prep 将执行流程并生成输出文件或发布数据源。

注意,如果一个流程有多个输出,它们可以独立运行或同时运行。



以上就是关于「Tableau Prep 界面」的全部内容。感谢观看本视频,更多 Tableau 学习资源,请关注微信公众号“优阅达大数据生态”。

更多相关信息,请访问专题页: Tableau使用入门教程