Tableau高级可视化综述,包括逐步实例

Tableau是一种数据可视化工具,用于创建数据可视化、仪表板和故事。当我第一次开始使用这个工具时,我经常使用Show Me功能来创建数据可视化。该功能允许用户创建常见的可视化类型,如条形图和折线图。

虽然标准的可视化效果很好,但在某些情况下需要使用高级技术。最近我创建了一个展示Shark Tank节目上交易的仪表板。以下是该仪表板中使用的一些高级可视化技术,以及如何逐步重新创建这些可视化效果的指导 – 使用相同的数据集或不同的数据集!这个列表还可以是学习不同可视化类型和头脑风暴如何将它们应用于其他工具的好方法!
本文介绍以下6种数据可视化技术。
最终仪表板可以在这里查看。关于数据集的其他信息可以在这里找到。
注意:其中几个可视化效果使用了字段记录数量。在创建任何可视化效果之前,请创建一个新的字段,记录数量,并将其值设置为1。要查看包含所有计算字段的数据集,请从上面链接的仪表板或此处下载数据集。
圆环图
圆环图与饼图类似,显示了部分与整体之间的关系。它们的不同之处在于圆圈中间有一个空洞,就像一个甜甜圈。
在Shark Tank仪表板中的圆环图显示了总共的创意提案数量,并按是否达成交易进行了分段。
要创建这个圆环图,首先在一个新的工作表中创建一个饼图。
从数据面板中,将记录数量(即创意提案数量)添加到列架,将达成交易添加到行架。
注意:确保将“达成交易”度量单位转换为维度,如下图所示。

从”展示”选项卡中选择饼图可视化类型。这将生成甜甜圈图的基本可视化。

在行架上添加两个新的度量值。在行架上两次输入AVG(0)(即AVG(0) AVG(0))。添加到行架后,你将看到两个饼图。

在第二个度量值上的行架上选择”双轴”,以重叠这两个饼图。

这两个饼图现在将彼此重叠。调整每个饼图的大小以创建甜甜圈形状。在标记卡上,选择”大小”并通过将滑块向右移动来增加饼图的大小。

要创建内部甜甜圈,请调整第二个或底部饼图。在标记卡上导航到第二个度量值的卡片,并删除所有字段。在本例中,有4个字段要删除。

删除这些字段将导致中心出现一个灰色的圆圈,这是甜甜圈图的中心。调整标记卡上的大小以调整甜甜圈的大小。

使用标记卡调整甜甜圈图中心的颜色。

使用第一个饼图,即标记卡下的第二个图块,调整甜甜圈图的标签和颜色。

通过将一个度量值移动到“全部标记卡片”的标签上,将文本添加到甜甜圈图的中心。

右键单击标题,取消选中“显示标题”以删除轴标题。

在工作表上的任何位置右键单击,然后选择“格式”以打开“格式”窗格。使用“格式”窗格隐藏网格线、调整边界、更改背景颜色等。

以下图片显示了最终的甜甜圈图,在使用“标记”卡片和“格式”窗格进行格式化后。

桑基图
桑基图显示一个实体到另一个实体之间的流动。在Shark Tank仪表板中的桑基图显示了投手性别(即团队组成)到行业之间的流动。
步骤1:自我联合
要创建一个桑基图,先上传数据集,然后创建一个数据源的自我联合。下图显示了已加载的数据集,总共有1274条记录和50个字段。

要创建一个自我联合,将“Shark Tank US数据集”从工作表中拖放到画布上的“Shark Tank US数据集”上。注意行数从1274条增加到2548条。

自我联合创建了两个字段 —— “表名”字段将在此练习中使用。

步骤2:创建新字段和分段
为了开发这个桑基图,创建七个计算字段和一个分段。打开一个新的工作表并创建以下计算。注意:下面以粗体列出字段名,然后是相应的计算。
- ToPad: 如果 [表名] = ‘Shark Tank US 数据集’ 那么返回1,否则返回49
- Padded:右键单击ToPad字段,选择创建 → 划分以创建一个名为Padded的新划分。将划分的大小设置为1。
- t:(INDEX() – 25) / 4
- Rank 1:RUNNING_SUM(SUM([记录数]))/TOTAL(SUM([记录数]))
- Rank 2:RUNNING_SUM(SUM([记录数]))/TOTAL(SUM([记录数]))
- Sigmoid:1 / (1 + exp(1)^-[t])
- Curve:[Rank 1] + (([Rank 2]-[Rank 1])*[Sigmoid])
- Deal Sizing:WINDOW_AVG(SUM([记录数]))
注意:Rank 2 是 Rank 1 的重复项
以下图片展示了在Tableau中创建计算字段ToPad的示例。

以下图片展示了如何在ToPad上创建名为Padded的划分,划分大小为1。

步骤三:开发Sankey可视化
将t放入列窗格,Curve放入行窗格,并将Padded放入Mark卡片的详细信息中。

将Industry、Pitchers Gender和Table Name放入Mark卡片的详细信息中。

在Curve度量上,在行窗格中选择编辑表格计算。

对于Rank 1,更新表格计算如下:
- 选择使用特定维度进行计算
- 勾选以下字段:Pitchers Gender、Industry、Padded、Table Name
- 确保Pitchers Gender位于顶部,因为它将出现在Sankey图的左侧

对于排名2,按照以下方式更新表格计算:
- 选择计算使用特定维度
- 勾选以下字段:行业、投手性别、填充、表格名称
- 确保行业位于顶部,因为它将位于桑基图的右侧

对于t,按照以下方式更新表格计算:
- 选择计算使用特定维度
- 勾选以下字段:填充

现在,在列架上选择“编辑表格计算”选项中的t度量标准。对于t,按照以下方式更新表格计算:
- 选择计算使用特定维度
- 勾选以下字段:填充

桑基图将在工作表上开始成形。

通过更改标记卡上的行业和投手性别字段的标记类型,为桑基图添加颜色,如下图所示。将“Got Deal”和“投手性别”添加到筛选器卡中,以对数据集进行筛选以显示交易数量。

编辑X和Y轴范围。要编辑轴,右键单击轴并选择“编辑轴”。
对于Y轴(曲线),将范围更改为从0开始。

对于X轴(t),将范围更改为-5到5。

隐藏每个轴的标题,使视觉更清晰。 (注意:要做到这一点,请右键单击标题,取消选中“显示标题”)
将Deal Sizing移动到标记卡上的大小,并增加大小以增加图表上的线条粗细。这些线条的粗细反映了从Pitchers Gender到Industry流动的交易数量。在Deal Sizing上,选择使用Padded进行计算,如下图所示。

第4步:创建桑基图的末端
桑基图需要两个柱状图,分别用于每个末端(Pitchers Gender和Industry)。打开一个新工作表,创建一个柱状图。下图显示了一个关于Pitchers Gender的柱状图。注意:用于Pitchers Gender的颜色方案也在桑基图的主要部分中使用。

重复上述步骤,为Industry字段创建一个柱状图,但这次选择灰色调色板。

现在是将所有内容放在一起的时候了!创建一个新的仪表板,并将三个工作表添加到一起,如下所示。使用格式窗格调整背景颜色和边框。

第5步:添加仪表板操作
添加以下仪表板操作以启用桑基图的悬停功能。
要添加仪表板操作,请从主菜单中选择“仪表板” → “操作” → “添加操作” → “突出显示”。

对于Pitchers Gender,添加以下突出显示操作。

这将允许用户将鼠标悬停在左侧的图表上,并查看交易流向右侧的位置。

为Industry创建另一个高亮动作。再次选择仪表盘→操作→添加操作→高亮。
输入以下信息以创建Industry的悬停高亮动作。

用户现在可以将鼠标悬停在Industry上,查看制定交易的发起人性别比例。

词云
词云显示文本中最常见的单词,最频繁出现的单词显示最大。单词以“云”的形状排列,因此得名为词云。在某些情况下,词云很有用,例如可视化文本列中的词频。
要创建词云,需要一个维度(分类变量)和一个度量(数值变量)。本节显示如何重新创建Shark Tank Deals 仪表盘中的词云。该词云显示每个行业的交易数量。
首先,打开一个新的工作表。将Industry移动到标记卡的文本上,将Number of Records(即拍卖次数)移动到大小(Size)上。另外,将Industry移动到颜色上。

这将结果呈现为下面的热力图。为了将此可视化转换为词云,在标记卡上,将可视化类型更改为文本。

这将生成一个词云。使用标记卡进行格式更改。

棒棒糖图表
棒棒糖图表类似于条形图。它们显示不同类别之间的频率。棒棒糖图表与条形图的区别在于视觉显示。条形图使用矩形显示每个类别的值,而棒棒糖图表在每个条形的顶部添加一个圆圈。创建信息图表或仪表盘时,这种类型的可视化很有用。
Shark Tank 仪表盘中的棒棒糖图表显示了按照投资人计算的交易数量。
首先,将Got Deal和Measure Names添加到列架上。通过选择字段上的选项,将Got Deal转换为离散维度。

将Measure Values两次添加到行架上。不用担心,在接下来的几个步骤中,棒棒糖图表将开始成形!

在第二个Measure Values字段上,选择双轴。

右键单击其中一个y轴,选择同步轴。

在Measure Values卡片上,添加以下字段:Barbara Invested,Daymond Invested,Kevin Invested,Lori Invested,Mark Invested,Robert Invested。将这些字段都更改为“Measure(Sum)”,如下图所示。从Measure Values卡片中删除不在此列表中的任何其他字段。

将Got Deal添加到过滤器卡片中。筛选Got Deal = 1,相当于“已成交”。

在标记卡片上,将Measure Values卡片上的图表类型更改为条形图,并调整大小。

在第二个Measure Values卡片上,将类型更改为圆圈,并使用大小瓷砖调整大小。

将Measure Values药片移动到Measure Values标记卡片上的文本瓷砖上,以在图表上添加标签。

右键单击y轴,取消选中“显示标题”,以去除额外的标题。使用格式窗格更改背景颜色,格式化轴线并修改文本标签。要打开格式窗格,请右键单击工作表并选择“格式”。

以下图片显示了最终的棒棒糖图表。

径向图表
径向图表是显示分类信息的另一种方式。径向图表可以是条形图的很好替代品。
在Shark Tank 仪表盘中,径向图表显示了交易中鲨鱼的数量。在Tableau中创建径向图表需要一个维度和一个度量值。此外,还需要创建9个计算字段和1个分组。以下步骤介绍了如何重新创建此图表。
步骤1:自联接
要创建径向图表,上传数据集,然后创建数据源的自联接。以下图片显示了加载的数据集,总共有1274条记录和50个字段。

要创建自联接,将Shark Tank美国数据集从表拖放到画布上的Shark Tank美国数据集上。注意行数从1274增加到2548。

自联接创建了两个字段——表名称字段将在本次操作中使用。

步骤2:创建新字段和分组
要创建这个径向图表,需要9个计算字段和1个分组。打开一个新的工作表,并按照以下顺序创建以下计算字段。注意:下面以粗体列出字段名称,后面是相应的计算。
- 路径:如果([表名称] = ‘Shark Tank美国数据集’,0,270)
- 路径(分组):—右键单击路径字段,选择创建→分组,创建一个名为路径(分组)的新分组。将分组的大小设置为1。
- 索引-1: INDEX()-1
- 总类别交易: WINDOW_SUM(SUM([记录数]))/2
- 总交易: WINDOW_SUM(SUM([记录数]))/2
- 百分比计算: [总类别交易]/[总交易]
- 排名计算: RANK_UNIQUE([总类别交易], ‘asc’)
- 大小计算: [百分比计算]/WINDOW_MAX([百分比计算])
- X: SIN(RADIANS([索引-1])*[大小计算]) * [排名计算]
- Y: COS(RADIANS([索引-1])* [大小计算]) * [排名计算]
The following image shows an example of how to create the calculated field, PATH, in Tableau.

The following image shows how to create a bin on PATH called Path (bin), with a bin size of 1.

步骤3:创建可视化
将Number of Sharks in Deal移动到Marks卡片上的颜色图块,将Path(bin)移动到行架上。勾选在Path(bin)字段上显示缺失值。

在Marks卡片上,将标记类型更改为线条。将Path(Bin)从行架移动到Marks卡片上的路径。确保Number of Sharks是一个维度,而不是显示求和。

将X移动到列架上,将Y移动到行架上。

选择在Y上编辑表格计算。

对于Index-1,按照以下方式更新表格计算:
- 选择使用特定维度计算
- 勾选以下字段:PATH(bin)

对于Size calc,按照以下方式更新表格计算:
- 选择使用特定维度计算
- 勾选以下字段:Number of sharks in deal,PATH(bin)
- 确保Number of sharks in deal在顶部

对于总猫交易量,更新表格计算如下:
- 选择特定维度进行计算
- 选择以下字段:路径(二进制)

对于总交易量,更新表格计算如下:
- 选择特定维度进行计算
- 选择以下字段:交易中的鲨鱼数量,路径(二进制)
- 确保交易中的鲨鱼数量位于顶部

对于等级计算,更新表格计算如下:
- 选择特定维度进行计算
- 选择以下字段:交易中的鲨鱼数量

选择X上的编辑表格计算。

对于指数-1,更新表格计算如下:
- 选择特定维度进行计算
- 选择以下字段:路径(二进制)

对于尺寸计算,更新表格计算如下:
- 选择特定维度进行计算
- 选择以下字段:交易中的鲨鱼数量,路径(二进制)
- 确保交易中的鲨鱼数量位于顶部

对于总猫交易量,更新表格计算如下:
- 选择特定维度进行计算
- 选择以下字段:路径(二进制)

对于总交易,请按以下方式更新表格计算:
- 选择使用特定维度进行计算
- 选中以下字段:交易中的鲨鱼数量,路径(bin)
- 确保交易中的鲨鱼数量位于顶部

对于排名计算,请按以下方式更新表格计算:
- 选择使用特定维度进行计算
- 选中以下字段:交易中的鲨鱼数量

更新完成表格计算后,径向图的底部开始形成。

第四步:额外的格式设置
使用标记卡进行视觉格式设置,调整线条粗细、颜色和标签。下图显示了在每条线的起点添加标签和分配新的调色板。还可以使用左侧的格式窗格去除边框并调整背景。

下面的图片显示了最终的径向图。

嵌套柱状图
Tableau中的另一种高级可视化技术是嵌套柱状图。嵌套柱状图是一种堆叠柱状图的方式,允许您比较一个类别的两个数值。虽然这种可视化类型没有出现在最终的仪表板中,但下面的示例展示了如何使用这些数据创建嵌套柱状图。下面的嵌套柱状图显示了按行业的交易和提案数量。
首先在工作表上创建两个柱状图。将行业放到行架上,将记录数量(即总提案数)和获得交易放到列架上。

在获得交易的下拉选项中,选择“双坐标轴”。

右键点击其中一个x轴,然后选择“同步轴”。

在所有标记卡上,将类型更改为条形图。

使用记录数和成交数标记卡调整条形的大小。使成交数条形(深蓝色)比记录数条形(浅蓝色)要小,如下图所示。

使用标记卡添加标签并根据需要格式化图形。下图显示了最终的嵌套条形图。

这涵盖了Tableau中的6种高级可视化!尽管这些示例是在Tableau中创建的,但请记住这些可视化也可以使用其他工具创建。在开发下一个数据可视化时,将它们作为灵感!
最终的仪表板可在此处查看或下载源资料。
Payal是一位数据与AI专家。在空闲时间,她喜欢阅读、旅行,并在VoAGI上写作。如果您喜欢她的作品,请关注或订阅她的列表,不会错过任何故事!
以上文章是个人观点,不一定代表IBM的立场、策略或观点。
参考资料
[1]: Thirumani, Satya. “🦈 Shark Tank Us Dataset 🇺🇸.” Kaggle, 2023年8月28日,www.kaggle.com/datasets/thirumani/shark-tank-us-dataset。 (CC0:公共领域许可证)