优阅达 | Tableau 微课堂(63):Tableau Prep 界面
Tableau Prep 界面浏览
Tableau Prep 可以让你清理、聚合和组合数据,为分析做准备。打开 Tableau Prep 时,会出现一个开始界面。

最右侧是“探索”窗格,其中包含“培训”和教育相关内容的链接。
在中间部分,会出现最近的流程文件和示例的链接。
左边是“连接”窗格。我们可以从“连接”窗格中选择数据源并将表拖出。

这里可以创建流程中的第一步,即输入步骤。每个流程都必须从输入步骤开始,一个流程中可有多个输入步骤。
当我们在流程窗格中选择一个步骤时,它的相关窗格将在下面打开。我们可以通过选择引入单个表或创建通配符并集来配置输入。

如果数据源足够大到需要进行抽样,还可以配置抽样。

在右边,可以看到数据中的字段,并可以选择将哪些字段带入 Tableau Prep。

还可以在此设置筛选器,限制将哪些数据带入流程的其他部分。

要添加另一个步骤,只需单击流程中前一步的加号,而后便可以从清理步骤、聚合、转置、并集、联接或输出中进行选择。

在流程中,清洗步骤作为一个简单的条出现。下面是“概要”窗格,它以卡片的形式显示数据中的字段。

每张卡片显示该字段中的值和每个值的行数,从而深入了解数据中的结构和关系。
清洗操作可以在每张卡片的下拉菜单或上下文工具栏中找到。

我们还可以通过直接交互进行一些清理,例如更改数据类型或重命名字段。

执行每种类型的清理操作都将作为流程窗格中清理步骤上方的注释出现,并可以在左侧的更改中进行跟踪。

“概要”窗格下面是数据网格,它将显示数据行,类似于电子表格视图。

步骤类型
现在,打开一个更复杂的流程,看看在 Tableau Prep 中还可以做什么步骤。

把它分解成几个部分——第一部分,通过一系列的清洗操作清洗了一月份畅销书的数据,再通过一系列的联接将它们重新组合在一起。

这个部分是对2月份数周数据进行了联接。3月也是一个转折点,这三个月的数据将重新联接。

这一部分是将另一个数据源引入销售信息,并将其从事务性数据聚合到图书级数据,然后将其与畅销书联接起来。
最后,还通过另一个联接引入电影改编数据,并为完全清洗后的数据源生成输出。

Tableau Prep 流程中的每种步骤类型都在这里得以呈现。单击流程的任意部分,可以打开与该步骤相关的窗格。

转置步骤
首先,看其中一个流程,由流程中的“从列到行”图标指示。字段从字段的左侧列表中移到“转置”值下拉区域。
结果(即旋转字段)显示在右侧,同时具有概要窗格视图和数据网格视图。

聚合步骤
接下来,单击聚合步骤。步骤由流程中的 Sigma 图标表示。
字段再次显示在左侧,并被带到分组字段区域或聚合字段区域,这取决于聚合应该如何处理每个字段。

并集与联接步骤
合并数据可以通过并集(使用相同的列结构添加更多行)或联接(向现有数据行添加新列)来完成。
让我们看看并集步骤。左侧显示了进入并集的输入,在右侧,我们看到结果的“概要”窗格和数据网格视图。

每个字段的卡片显示一个彩色条,显示该字段中存在哪些数据输入。

如果需要合并字段,只需简单地拖放即可。

这里还生成了一个“表名”列,其中包含关于每行来自哪个数据源的信息。

联接是另一种合并数据的方法。联接步骤为配置联接提供了一个可视化接口。
在最左边,我们可以构建一个或多个联接子句,选择要联接哪些字段以及如何联接。

我们可以通过单击关系图来选择联接类型。

在联接类型下,可以看到结果的摘要,显示匹配的内容(包括在结果中)或不匹配的内容(排除在结果中)。

如果我们更改联接类型,就会看到更新后的结果摘要。

在联接配置窗格的右侧,我们看到联接子句的细分。红色的值是不匹配的,黑色的值是匹配的。

在更右边,是可以看到结果的“概要”窗格和数据网格视图。

输出步骤
最后,数据被清理成形并组合到我们满意的程度后,就必须输出数据。
保存流程文件(.tfl)将保存流程本身,而不是生成数据输出。
打包的流程文件(.tflx)包括平面文件的流程和提取(尽管不是来自数据库连接的数据),并且与输出完成的、已清理的数据不同。
要创建完成的数据源,必须将“输出步骤”添加到流程中,然后运行流程。
在“输出”窗格中,右侧显示完成的数据的数据网格预览。

在左侧,可以配置输出。它既可以保存到文件中,也可以作为数据源发布。可以将文件命名和设置为.hyper提取、.tde提取或.csv,还可以指定文件的保存位置。

单击“运行流程”将执行流程并生成输出文件或发布数据源。注意,如果一个流程有多个输出,它们可以独立运行或同时运行。

本节 Tableau 微课堂到此结束,感谢你的耐心阅读。
下节课,我将带你学习了解 Tableau Prep 输入步骤。
400 998 0226
Tableau
Tableau
Minitab

Alteryx











Neo4j











Talend


















IM
华为云
腾讯云
IT/安全