All 基础入门

Alteryx 微课堂 | 第4课:手动输入数据

published: 2023-03-10

本节课我们一起来学习:手动输入数据,包括文本输入工具的使用方式,通过手动添加、移除数据来编辑数据集。

为便于大家更好地跟随操作,接下来,我把视频的内容用图文形式进行拆解。

一、手动输入数据的重要性

在工作流中输入数据,作为验证工作流过程的测试数据集,或者为不清楚的数据值或代码添加意义,这并不少见。虽然使用手动输入的数据存在将错误引入分析过程的风险,但它也扩展了工作流中数据的灵活性和可访问性

二、数据集探索

以纽约市树木数据为例,工作流包含三个输入数据工具,每个工具都用于读入树木数据的文件。在大多数情况下,这些输入数据集中的列包含明确的和直观的值。除了“行政区代码”,它包含 1 到 5 的值,每个值代表纽约市的一个行政区。

然而,除了一棵树被分配一个数字,这些数字与一个行政区对应之外,对这些信息的一般理解是有限的。如果能手动输入相关数据,我们的分析将极大地受益于理解这些值,更容易理解树木所在的位置。

三、手动输入数据

为了阐明这些代码的含义,可以直接在 Designer 中创建一个简单的查找表,将每个区代码与其名称关联起来。

1、拖入文本输入工具

因为要定义的值的数量很小,只有两个列是必要的,一列是自治区代码,另一列是自治区名称,而使用文本输入工具手动输入这些数据并不麻烦。

拖一个文本输入工具到画布上。文本输入工具的配置提供了一个可用于自定义输入的空白表,包含列和行的数据集。创建一列数据值,以匹配输入中当前存在的数据值。在第一列的标题中,输入“区号”来命名该列。

这一列将包含纽约五个行政区的代码值:数字 1、2、3、4、5,在“区号”列的空单元格中输入“1”。单元格填充后,“区号”列中的另一个空单元格将直接出现在值1。在这个新的空单元格中,输入值“2”。然后,继续在空单元格中输入剩余的区号,行政区的定义从1到5分别是曼哈顿区、布朗克斯区、布鲁克林区、皇后区和斯塔顿岛,在相关代码旁边的单元格中输入每个区名。

2、复制粘贴

将现有文件(如 Alteryx 数据库)的内容复制并粘贴到文本输入工具中。单击图标将文件的内容复制到剪贴板,并从菜单中选择“所有带标题的记录”。在文本输入工具的配置中,单击粘贴图标,用复制的数据填充文本输入。

3、输入查找表

在文本输入工具的配置中,单击图标导入文件。这个对话框与输入数据工具配置中的对话框相同。使用此选项,选择要导入到文本输入工具中的输入文件。一旦文件的内容填充了文本输入工具,就可以手动编辑其内容。

4、删除不需要的列和行

这个特定的输入文件包含额外的列,即“土地面积平方公里”和“流行密度”列,这些列在分析中是不必要的,应该被删除。突出显示列的土地面积和人口密度。然后,单击“删除”按钮,并从菜单中选择列。

5、完成表

现在,这个表可以用于将在工作流的下游进一步实现的数据混合过程。与机器或网络上的文件或连接外部链接的数据不同,文本输入工具的数据“存在”于工作流中。这意味着数据值不仅是静态的,而且对你选择与之共享此工作流的任何人都可以访问。

四、修改数据类型

在结果窗口中,单击“元数据”。文本输入工具已经分配了数据类型“字节”,这是数值,大小为 1 的列自治区代码。在其他输入数据工具中,相同的值列作为字符串输入。

因此,为了匹配其他输入中的数据类型,需要对此数据类型进行更改,特别是在稍后需要将此列用于工作流中数据混合的情况下。列自治市镇名称已被分配字符串数据类型,该类型适用于其包含的值。但是,当涉及到数据值的长度时,字符串数据类型没有任何内置的灵活性。幸运的是,这个数据是静态的,不会向这个表中引入其他值,所以这个数据类型可以保持不变。文本输入工具中的任何空值都将被分配一个空值。

以上就是关于「手动输入数据」的全部内容。感谢观看本视频,更多 Alteryx 学习资源,请持续关注 Alteryx 社区。