构建和组织流

  • 版本 :2022.1 及更高版本

注意:从版本 2020.4.1 开始,您现在可以在 Tableau Server 和 Tableau Online 中创建和编辑流。除非特别说明,否则本主题中的内容适用于所有平台。有关在 Web 上创作流程的详细信息,请参阅Tableau Server(链接在新窗口中打开)和Tableau Online(链接在新窗口中打开)帮助。

连接到要包括在流程中的数据后,您可以首先通过向流程中添加新步骤或在现有步骤之间插入步骤来清理和调整数据。

若要组织流程,您可以更改默认步骤颜色、添加说明以提供步骤或清理操作的上下文,或者重新组织流程布局以便能更轻松地跟进复杂流程。

添加或插入步骤

构建流程时,您可以添加不同的步骤类型来执行所需的操作。例如,添加“清理步骤”来执行像拆分字段、应用筛选器这样的操作,或执行各种其他操作来清理不良数据。使用“联接”“合并”步骤类型来合并数据表,或者添加“脚本”步骤类型,以将 R 或 Python 脚本合并到流程中。

当流程开始成形时,您可能需要回到流程中较早的步骤,并插入不同的步骤类型来执行各种操作,比如添加其他清理步骤,或者聚合数据以使用与后续步骤相同的详细级别。

注意:您看到的菜单选项将因 Tableau Prep Builder 版本以及是添加步骤在流程中构建新步骤还是在现有步骤中插入步骤而异。如果使用的是 Tableau Prep Builder 版本 2019.3.1 或更低版本,请参考该部分来查看菜单选项。

您无法使用这些菜单添加输入步骤。作为替代,您需要将表从“连接”窗格拖到“流程”窗格。 有关详细信息,请参见连接到数据。

添加步骤

连接到数据并将表格拖到画布上后,单击加号按钮 从菜单中选择步骤类型,或单击建议的清理步骤(Tableau Prep Builder 版本 2020.3.3 及更高版本以及在 Web 上)以自动向流程中添加清理步骤。

选择一种步骤类型:

  • 清理步骤:添加清理步骤以执行各种清理操作。有关可使用的不同清理操作的详细信息,请参见清理和调整数据。

    注意:在 Tableau Prep Builder 版本 2019.4.2 中,“添加分支”选项已替换为“清理步骤”选项。若要将流程拆分为不同的分支,请单击两个现有步骤之间的加号 按钮,然后从“添加”菜单中选择步骤类型。

  • 新建行:生成新行以填补顺序数据集中的空白。有关详细信息,请参见填补顺序数据中的空白。

    聚合:创建“聚合”步骤以选择字段并更改其详细级别。有关详细信息,请参见对值进行聚合和分组。

  • 转置:创建一个“转置”步骤以执行各种转置选项,例如将列数据转换为行,或将行数据转换为列。您还可以设置通配符转置以自动向转置添加新数据。有关详细信息,请参见转置您的数据。

  • 联接:创建一个“联接”步骤以合并数据表。通过菜单选项创建联接时,您必须手动将其他输入添加到联接,并添加联接子句。作为替代方案,您可以通过拖放步骤(如下所示)来自动联接文件。有关创建联接的详细信息,请参见联接数据。

    如果连接到的数据库包含具有关系数据的表,您也可以通过“流程”窗格中的菜单创建联接。有关使用此方法联接表的详细信息,请参见在“输入”步骤中联接数据(链接在新窗口中打开)

  • 并集:创建一个“并集”步骤。通过将表拖动到步骤并将其放在显示的“添加”选项上,将表添加到并集中。作为替代方案,您可以将步骤拖放到另一个步骤上来合并文件。有关创建并集的详细信息,请参见合并数据。

  • 脚本Tableau Prep Builder 版本 2019.3.1 及更高版本以及在 Web 上):创建一个“脚本”步骤,以便在流程中包含 R 和 Python 脚本。Tableau Cloud 当前不支持脚本步骤。有关详细信息,请参见在流程中使用 R 和 Python 脚本。

  • 预测:使用 Einstein Discovery 驱动的模型对流程中的数据预测进行批量评分。有关详细信息,请参见将 Einstein Discovery 预测添加到您的流程。

  • 输出:创建一个“输出”步骤,以将输出保存到数据提取文件 (.hyper),一个 .csv 文件,将输出作为数据源发布到服务器,或将流程输出写入数据库。

    在 Web 上,当前不支持将输出步骤保存到文件。有关输出类型的详细信息,请参见保存和共享工作。

  • 粘贴:添加从同一流程中复制的步骤。有关在同一流程中复制和粘贴步骤的详细信息,请参见清理和调整数据。

  • 插入流程Tableau Prep Builder 版本 2019.3.2 及更高版本以及在 Web 上):将从其他流程保存的流程步骤添加到当前流程中。您可以将它们添加到步骤的末尾,或将其插入到现有步骤之间。有关在流程步骤中使用已保存流程步骤的详细信息,请参见创建可重用的流程步骤

    注意:Tableau Prep Builder 版本 2019.4.2 中,此选项已添加到此菜单中。在以前的版本中,您可以通过流程窗格的空白区域中右键单击或按住 Ctrl (MacOS) 单击来添加流程步骤。

插入步骤

在现有步骤之间插入一个步骤。“输入”和“输出”步骤类型在此菜单中不可用。选项因产品版本而异。如果使用 Tableau Prep Builder 的早期版本,请参考下面的“版本 2019.3.1 及更低版本”部分。

  1. 将光标悬停在要在其中插入流程的流程线的中间,直至出现加号 图标。然后单击该图标并选择一种步骤类型。

    注意:您的选项可能看起来不同,具体取决于您的产品版本。例如,Tableau Prep Builder 版本 2019.4.2 的此菜单中增加了“插入流程”

  2. 选择一种步骤类型:

    • 清理步骤:在现有步骤之间插入清理步骤以执行各种清理操作。有关可使用的各种清理操作的详细信息,请参见清理和调整数据。

    • 新建行:生成新行以填补顺序数据集中的空白。有关详细信息,请参见填补顺序数据中的空白。

    • 聚合:在现有步骤之间插入一个“聚合”步骤,以选择字段并更改其详细级别。 有关详细信息,请参见对值进行聚合和分组。

    • 转置:在步骤之间创建一个“转置”步骤以执行各种转置选项,例如将列数据转换为行,或将行数据转换为列。您还可以设置通配符转置以自动向转置添加新数据。有关详细信息,请参见转置您的数据。

    • 联接:在现有步骤之间插入一个“联接”步骤。通过菜单选项创建联接时,您必须手动将其他输入添加到联接,并添加联接子句。作为替代方案,您可以通过拖放步骤(如下所示)来自动联接文件。

      有关创建联接的详细信息,请参见联接数据。

      如果连接到的数据库包含具有关系数据的表您也可以通过“流程”窗格中的菜单创建联接。有关使用此方法联接表的详细信息,请参见在“输入”步骤中联接数据(链接在新窗口中打开)

    • 并集:插入一个“并集”步骤。通过将表拖动到步骤并将其放在显示的“添加”选项上,将表添加到并集中。作为替代方案,您可以将步骤拖放到另一个步骤上来合并文件。有关创建并集的详细信息,请参见合并数据。

    • 脚本Tableau Prep Builder 版本 2019.3.1 及更高版本以及在 Web 上):插入一个“脚本”步骤,以便在流程中包含 R 和 Python 脚本。Tableau Cloud 当前不支持脚本步骤。有关详细信息,请参见在流程中使用 R 和 Python 脚本。

    • 预测:使用 Einstein Discovery 驱动的模型对流程中的数据预测进行批量评分。有关详细信息,请参见将 Einstein Discovery 预测添加到您的流程。

    • 粘贴:在现有步骤之间插入从同一流程中复制的步骤。有关在同一流程中复制和粘贴步骤的详细信息,请参见清理和调整数据。

    • 插入流程Tableau Prep Builder 版本 2019.3.2 及更高版本以及在 Web 上):将从其他流程保存的流程步骤插入到当前流程中。您可以将它们添加到步骤的末尾,或将其插入到现有步骤之间。有关在流程步骤中使用已保存流程步骤的详细信息,请参见创建可重用的流程步骤。

      注意:Tableau Prep Builder 版本 2019.4.2 中,此选项已添加到此菜单中。在以前的版本中,您可以通过流程窗格的空白区域中右键单击或按住 Ctrl (MacOS) 单击来插入流程步骤。

版本 2019.3.1 及更低版本

对步骤进行分组

在 Tableau Prep Builder 版本 2020.3.3 及更高版本中受支持,以及从版本 2020.4 开始,在 Tableau Server 或 Tableau Cloud 上受支持。

使用“分组”选项将大型复杂流程的各个部分划分到文件夹中,以便更轻松地跟踪流程并对其进行故障排查,或者与他人共享流程。您可以更改组的颜色、添加说明、将分组步骤复制并粘贴到流程的其他区域,(或者在 Tableau Prep Builder 中)甚至将分组的步骤保存到服务器上的文件以在其他流程中重用这些步骤。

创建组时,将应用以下条件:

  • 步骤必须与流程线直接连接。

  • 组中一次只能包括一个步骤。

  • 无法嵌套组。

  • 只要维护组中各步骤之间的流程线连接,即可随时在组中添加或移除步骤。这也适用于从已包含在组中的流程中移除步骤。在这种情况下,系统会自动将组取消分组。

创建组

在流程中选择一组连接的步骤(您也可以拖动以一键选择多个步骤),然后在所选步骤上右键单击或按住 Cntrl 单击 (MacOS) ,然后从菜单中选择“分组”

创建组后,可以执行以下任意操作:

  • 单击双箭头可随时展开或折叠组。

  • 通过拖动连接的步骤并将其拖放到折叠的文件夹中,向组添加更多步骤。

  • 从组中移除步骤。在展开状态中,右键单击或按住 Cntrl 单击 (Mac OS) 一个步骤,然后选择“从组中移除”

    注意:如果您尝试移除中断组连续性的步骤,则此选项不可用。

  • 在折叠状态下,右键单击或按住 Cntrl 单击 (MacOS) 可打开菜单,然后从以下选项中进行选择:

    • 重命名:更改组名称。

    • 添加说明:输入组的说明

    • 编辑颜色:更改组文件夹的颜色。这不会更改组中各个步骤的颜色。

    • 展开组:显示组中的所有步骤。您还可以单击双箭头 展开组。

    • 取消分组:从组中移除所有步骤并删除组。

    • 复制:将组和组中的所有步骤复制到剪贴板,以粘贴到流程中的其他地方。有关使用复制和粘贴的信息,请参见复制并粘贴步骤。

    • 将步骤另存为流程(仅限 Tableau Prep Builder):将分组的步骤本地保存到计算机上的文件,或将其发布到 Tableau ServerTableau Cloud 以与他人共享,或在其他流中使用它。有关保存步骤以供重用的详细信息,请参见创建可重用的流程步骤。

    • 移除:从流程中移除组和组中的所有步骤。

  • (版本 2021.1.2 及更高版本)在展开状态中,在展开的组区域中右键单击或按住 Cntrl 单击 (MacOS) 打开菜单以折叠组或取消步骤分组。

更改流程配色方案

默认情况下,Tableau Prep 会为流程中的每个步骤分配一种颜色。此配色方案将在整个流程中应用,帮助您在应用清理步骤、联接、合并或聚合数据时在整个流程中跟踪数据,让您知道哪些文件受到操作的影响。

若要为步骤选择其他配色方案,请执行以下操作:

  1. 选择一个或多个步骤。

  2. 右键单击或按住 Ctrl 单击 (MacOS) 选定步骤,并选择“编辑颜色”

  3. 单击调色板中的一种颜色来应用该颜色。

若要将步骤颜色重置回默认颜色,请执行以下操作之一:

  • 从顶部菜单中单击“撤消”

  • 按 Cntrl+Z 或 Command-Shift-Z (MacOS)。

  • 选择更改的步骤,右键单击所选的步骤,并选择“编辑颜色”,然后从调色板的底部选择“重置步骤颜色”

从流程中移除步骤

在流程中的任何位置,您可以移除步骤或步骤之间的流程线。

注意:您无法移除进入或退出折叠步骤组的流程线。您必须先展开组或取消对步骤进行分组。

  • 若要移除步骤或流程线,请选择要移除的步骤或流程线,右键单击该元素,然后选择“移除”

  • 若要移除多个步骤或流程线,请执行以下操作之一:

    • 使用鼠标拖动并选择一整段流程。然后右键单击或按住 Ctrl 单击 (Mac OS) 某个选定的步骤,并选择“移除”

    • 按 Ctrl+A 或 Cmd+A (MacOS) 选择流程中的所有元素,或按住 Ctrl 并单击或者按住 Cmd 并单击 (MacOS) 以选择特定元素,然后按 Delete 键。

为流程步骤和清理动作添加说明

在构建流程并执行各种清理操作时,您可能需要添加说明,帮助稍后可能会查看或使用您的流程的其他人更好地理解您的步骤。您可以直接在“流程”窗格中为流程中的任何单独步骤、任何步骤组添加说明,或为“更改”窗格中的任何清理动作添加说明来为更改提供其他上下文。说明最多可为 200 个字符长。

有关在“更改”窗格中查看更改的详细信息,请参见查看您所做的更改(链接在新窗口中打开)

为流程步骤添加说明

当您添加说明时,会在步骤下方添加一个消息 图标。单击图标以在“流程”窗格中显示或隐藏说明文本。

  1. 在“流程”窗格中,选择一个步骤。

  2. 执行以下操作之一:

    • 在步骤上右键单击或按住 Ctrl 并单击 (MacOS),然后从菜单中选择“添加描述”

    • 在步骤的名称字段中双击,然后单击“添加说明”

  3. 在文本框中键入说明。

  4. 在文本框外部单击,或按 Enter 应用您所做的更改。默认情况下,说明显示在步骤的下方。若要隐藏说明,请单击消息 图标。

  5. 若要编辑或删除描述,请右键单击或按住 Ctrl 并单击 (MacOS) 步骤或描述。然后从菜单中选择“编辑描述”“删除描述”

为更改条目添加说明

从 Tableau Prep Builder 版本 2019.1.1 开始以及在 Web 上,您可以在“更改”窗格中向条目添加描述。

  1. 在流程窗格中选择一个步骤。

  2. 打开“更改”窗格或“更改”选项卡。

  3. “更改”窗格中右键单击或按住 Ctrl 并单击 (MacOS) 一个条目,并选择“添加说明”

  4. 为更改动作输入说明。

    说明将出现在为带有注释图标的更改生成的文本的下方。

  5. 若要编辑或删除说明,请右键单击或按住 Ctrl 并单击 (MacOS) 更改项,然后选择“编辑说明”“删除说明”

重新组织流程的布局

在 Tableau Prep Builder 版本 2019.2.2 及更高版本中受支持,以及从版本 2020.4 开始,在 Tableau Server 或 Tableau Cloud 上受支持。

当您构建流程时,Tableau Prep Builder 使用默认布局。每个流程按从左到右的顺序布局和处理,“输入”步骤位于画布最左侧的开始位置,“输出”步骤位于画布右侧的结束位置。但是,如果构建复杂的大型流程,则流程会很快变得难以执行。

您可以选择并移动步骤,使流程布局按对您有意义的方式进行组织,从而清理流程的布局。例如,您可以修复交叉的流程线条,移动流程步骤以清理额外的空白,或者重新排列流程步骤以显示清晰的事件序列。

例如,下面的流程混乱不清,难以执行:

若要清理此流程,请选择并将步骤向上、向下、向左或向右拖放到画布中的新位置。无法将流程步骤移到会中断从左到右处理流程的位置。例如,您不能将位于联接步骤之前的合并步骤拖到流程中联接步骤之后的位置。

将流程步骤拖到允许的位置时,将显示一个橙色的框。如果不允许该位置,则不会显示橙色框,当您尝试放置步骤时,它们将返回到原始位置。

若要在流程中移除步骤,请执行以下操作:

  1. 在“流程”窗格中,选择要移除的步骤。您可以单击特定步骤,拖动以选择多个步骤,或按住 Ctrl 单击或按住 Cmd 单击 (MacOS) 以选择不相邻的步骤。

  2. 将步骤拖放到新位置。

    注意:如果您不喜欢所进行的重新组织移动操作,您可以在顶部菜单中单击“撤消”来撤消这些操作。但是,如果在移动步骤之间执行清理操作,您也可以撤消这些操作。“撤消”选项会按您执行它们时的步骤撤消您的操作。

观看“重新组织流程步骤”的实际运行效果

下面的示例演示使用拖放来重新排列流程的操作。

使用流程导航工具

在处理大型流程时,来回滚动以搜索要返回到的特定流程区域可能很困难。利用流程导航工具可以更轻松地完成此操作。流程导航器是流程的微缩版本,显示在画布的右下角。

单击图形的任何区域可跳转到流程的该区域,或使用以下工具栏 选项进行导航:

工具栏选项说明
折叠流程导航器图形。在折叠状态下,您可能只看到百分比指示器。只需将光标悬停在此项上来展开工具栏,然后单击向上箭头 即可再次展开图形。
展开流程导航器图形。
更改流程的大小以适合屏幕。
放大和缩小您的流程。您可以单击百分比指示器将视图还原到 100% 大小。