内容:

使用数据的提示

  • 版本 :2022.1 及更高版本

数据可以以各种方式进行组织。为了利用 Tableau Desktop,Tableau 建议您连接到格式化为分析的数据。具体而言,数据是: 尽可能细化而不是聚合(例如每日天气数据而不是月平均值) 像数据库表一样组织(而不是面向列的表,如交叉表) 剥离无关信息(任何不是数据及其标头的信息) 当数据结构化用于分析时,提出和回答问题要容易得多。Tableau 可以将原始数据聚合到所需的级别,而不受数据中已存在的聚合的限制。可以根据需要创建组和层次结构,并且可以在分析流中执行计算。 Tableau Desktop 具有基本的清理选项和数据解释器。对于更复杂的格式设置问题,可能需要进行 Tableau 准备。 以下特定于 Tableau 桌面的部分重点介绍并提供了解决一些常见格式或问题的建议,这些问题可能会使分析数据变得困难。

以交叉表格式透视数据

当数据格式设置为交叉表格式时,表是面向列的。在面向列的表中,变量存储为列标题。但是,Tableau Desktop 针对面向行的数据进行了优化。在面向行的表中,变量存储在行值中。

例如,假设您有面向列的表格,其中显示小学生的数学、科学和历史分数。

Tableau Desktop 经过优化,可连接到面向行的表,其中数学、科学和历史值组织在名为“主题”的列下,每个学生的分数组织在名为“分数”的列下。您可以通过手动编辑 Excel 数据来透视行中的列。或者,从桌面连接到 Excel 数据,然后使用透视选项。有关透视选项的详细信息,请参阅将数据从列透视到行

删除预先聚合的数据

数据通常可以预先聚合。也就是说,数据可以包含总和、平均值、中位数等。预聚合数据的常见示例以小计和总计的形式出现。小计和总计数据是根据原始数据计算的,但不是原始数据本身的一部分。

例如,假设您有一个包含一行小计信息的表。

在这种情况下,需要删除预先聚合的数据。要在分析中使用小计和总计,请手动从表中移除此类信息。然后,从桌面连接到 Excel 数据,并使用总计选项计算小计和总计。有关详细信息,请参阅在可视化效果中显示总计。或者,从桌面连接到 Excel 数据,打开“数据解释器”,然后使用总计选项。有关更多信息,请参阅使用数据解释器从 Excel、CSV、PDF 和 Google 表格中清除数据

移除或排除介绍性文字

作为报表提供的 Excel 数据可以包含介绍性文本的标题或块。由于 Desktop 需要表的第一行中的列标题或行值,因此此信息可能会导致分析过程中出现问题。

例如,假设您有一个包含报表标题和日期的表。

在这种情况下,需要删除标题和日期信息。若要对报表使用标题和日期,请执行下列操作之一:

Flatten hierarchical headers to a single row

In general, Tableau Desktop expects only the first row in your Excel data to contain column headers. Data that contains multiple layers of column headers can cause problems during your analysis.

For example, suppose you have a table that contains one major header and multiple sub-headers.

In this case, the hierarchy of headers must be flattened or removed. To do this, you can manually create a new column for each header in the hierarchy directly in your Excel data. Alternatively, connect to your Excel data from Tableau Desktop and then turn on Data Interpreter. Verify that your headers are flattened correctly. For more information about Data Interpreter, see Clean Data from Excel, CSV, PDF, and Google Sheets with Data Interpreter.

Make sure there are no blank cells

If you create new columns for your hierarchical headers, make sure that each cell in the new columns contains values.

While you might repeat the same value for each row, it's important that each row contains the data that associates it with the data that was stored in the hierarchical header. You must manually remove blank cells from your Excel data.

Remove blank rows

Make sure that there are no blank rows in your data. To fix blank rows, you must remove the blank rows from your Excel data.

添加缺少的标头

确保没有缺少列标题。若要修复缺少的标头,必须手动将缺少的标头直接添加到 Excel 数据中。