1.数据分层(层级)结构

1.1分层结构的概念与意义

分层结构是维度之间自上而下的组织形式。

Tableau默认包含对某些字段的分层结构,比如日期、时间、地理角色。

以日期为例,包含年、季度、月、日等数据分层结构。

打开“全球超市订单数据.xlsx”。

将两个工作表数据拖到右侧。联结为内部联结。

将【利润】拖到【行】,将【订单日期】拖到【列】,点击【年(订购日期)】右侧的+,会往下分层(称之为下钻),并变成-,点击-,会把层折叠(称为上钻)。

1.2分层结构的创建与使用案例

打开“人工坐席接听数据.xlsx”。

中心和人工服务接听量柱形图

新建工作表2,右击【中心】——【分层结构】——【创建分层结构】。

命名为【层级】。

【维度】下变化如下

将字段【部】、【组】、【班】,拖到【中心】下面,注意顺序,上下顺序就是层级顺序。

将【中心】放到【列】中,将【人工服务接听量】放到【行】中,将【人工服务接听量】放到【标签】上。

点击【整个视图】。

右击【总和(人工服务接听量)】——【设置格式】,点击【数字】

【数字(自定义)】,设置小数位数为0,【显示单位】为千。

点击【列】里的【中心】左边的+,逐级下钻,进行分析,发现有【未知】字段数据太高,属于异常,排除掉。

点击【未知】的柱形,点击【排除】。

分析发现有两个班的数据比较高。

中心、日期和平均呼入通话时长折线图

新建工作表3,将【日期】拖入【列】,选择格式为【天】。

将【中心】拖入【行】,将【平均呼入通话时长】拖入行。

点击【中心】左边的+,下钻到【部】,并继续下钻,可以到【组】,到【班】。

不想用层级的话,右击【移除分层结构】。

第二种创建分层结构方式

将字段【部】拖到字段【中心】上,自动打开【创建分层结构】,命名为【层级】。如果字段上下顺序不对,则拖动调整。

右击【组】——【分层结构】——【添加到分层结构】,选择【层级】,则自动排到【层级】的最下面。

不想【组】在层级里,就直接把【组】往外拖。

注意,层级不能嵌套,但可以并列。

比如新建【层级2】,【层级2】不能放到【层级】里面。

2.数据分组

2.1数据组创建及使用

组是维度成员或度量的离散值的组合。

通过分组,可以实现维度成员的重新组合,以及度量值按范围的分类。

字段图标是回形针图标。

在Tableau里,归类重组维度成员有很多种方式,分组是其中最常见和最快速方式。

注意,组不能创建计算字段,不能出现在公式中。

新建工作表4。

将【班】拖到行中,将【人工服务接听量】放到列中。点击【交换行和列】。

发现13班和13班(15批新人)属于一个班。其他也有可以合到一个组的情况。

创建分组

创建分组有两种方式:

一是右击【班】——【创建】——【组】。

二是在图形里右击【组】(注意,要点击图形,而不是字段)。这里使用第二种方法。

出现【创建组】的对话框,点击【应用】和【确定】。

编辑组

右击带有回形针图标的【班(组)】——【编辑组】。

将【13班(15批新人)】拖到组【13班】下,如果组名不合适,可以右击组名——【重命名】。

按ctrl键,选择【15班】和【15期新人】,点击【分组】,则新建一组。

查找和分组

如果字段名称太多,点击【查找】,查找方式有三种

  • 包含,属于模糊查找,包含这个字就能找到
  • 开头为,则字段开头必须为这个字
  • 精确匹配,则查找字为全部字段。

【范围】是查找范围,指的是全部查询还是在某个组内查询,一般选全部。

想找到所有常白班,【查找成员】输入【白】,【包含】,【范围】选【全部】。点击【查找全部】。

找到后,默认结果是被选中的,点击【分组】,重命名为【常白班】。

同样,对【运行班】分组。

将一些字段分组,称为【其他班】。

修改图表

将【班】拖走,将【班分组】拖到【列】中。点击【交互行和列】。

右击【班分组】,去掉勾选【包含“其他”】

点击【降序】,点击【交互行和列】。

2.2电量销售数据按地理区域分组

打开文件“2014年各省市售电量.xlsx”

中国一般分为七个区:东北,华东,华中,华北,华南,西南和西北。

将省市按照七个区域分组。

建立地图

新建工作表,右击【维度】下【省市】——【地理角色】——【省/市/自治区】。

双击【省市】,点击【未知】,选择【编辑位置】。(注意,因为第七章中自定义地理编码,如果不移除会导致未知过多,点击【地图】——【地理编码】——【移除自定义地理编码】)

修改匹配位置,点击【确定】。

套索选择和建组

将【省市】拖到【标签】上。

点击地图上的【套索选择】按钮,先框选黑龙江,吉林和辽宁三省。

套索选择后,其他省份变灰,只显示选中的省份。

悬浮在【龙江】上,可以看见3省已选择,点击回形针标识,创建东北组。

同样使用套索,选择山东,江苏,安徽,上海,浙江,江西,福建。选择后悬浮在其中一个省份上,点击回形针标识,创建分组华东组。

华北组包括内蒙古,河北,山西,北京,天津。

华中组包括河南,湖北,湖南。

西南组包括重庆、四川和西藏。

西北组包括新疆、青海、甘肃和宁夏。

右击【省市(组)】——【编辑组】,重新命名字段名称和群组名称,点击【确定】。

将【当期值】拖入【大小】。

填充地图

新建工作表6,双击【中国地理区域】,将【同期值】拖到【颜色】,点击【颜色】——【编辑颜色】,选择【红色—蓝色发散】,勾选【倒序】。

将【中国地理区域】和【当期值】拖到【标签】上。

右击标签【总和(当期值)】——【设置格式】,【数字(自定义)】,小数位数为0,显示单位为千(K)。

添加说明,【标记】下空白处右击勾选【说明】,双击说明处,输入文字。

重命名工作表6为“各地区用电量”。【工作表】——【导出】——【图像】。

各区域用电量标靶图

新建工作表7。

将【中国地理区域】和【省市】拖到【行】,将【当期值】拖到列。

将【月度计划值】拖到【详细信息】。

右击坐标轴——【添加参考线】。

选择【分布】下【分区】。

【计算】里选择【百分比】,修改为【50,100】,百分比类型为【总和(月度计划)】。

【标签】选择【无】。

【格式】里【线】选择黑色直线,填充不修改,点击【确定】。

将【中国地理区域】拖到【颜色】,将【当期值】拖到【标签】。

右击标签【总和(当期值)】——【设置格式】。

修改填充颜色:右击坐标轴下方——【编辑参考线】,选择【向下填充】,然后可以选多种填充颜色。

也可以同时选择【对称】和【反向】。【对称】是指颜色沿着参考线对称。

添加说明,【标记】下空白处右击勾选【说明】,双击说明处,输入文字。

重命名工作表7为“电量销售区域标靶图”。【工作表】——【导出】——【图像】。

3.数据集

3.1数据集的相关概念

定义:集是满足某些条件的数据子集,它是维度的部分成员。

图标是

类型

名称 常量集 计算集
类型 静态集 动态集
是否会更新
可用维度度量 单个或多个 单个
创建方式 视图中选择 数据窗口创建

用途

  • 集内外成员的对比分析
  • 集内部成员的对比分析

3.2创建数据集

导入数据“全球超市订单数据.xlsx”

创建静态数据集

新建工作表8,找到负利润的国家数据集。

将【国家/地图】拖到【列】,将【利润】拖到【行】。

点击降序图标。

从数据开始为负数的国家开始往后选。

选择好后,悬浮在上面,选择创建集按钮。

修改集的名称,点击【确定】。

可见左侧【度量】下出现【集】。

将【市场】和【细分市场】拖到【列】中

将【利润】拖到【颜色】上。

修改【利润】的颜色,【渐变颜色】为2阶,勾选【倒序】。这样看的更清楚。

按ctrl键,将图表中蓝色的选出来。选好后右击【创建集】,修改集名称如下,点击【确定】。

右击【集】下【负利润国家2】——【编辑集】,将鼠标悬浮在每条记录的后边,会有×,如果不想要该记录,可以点击移除。

悬浮在列名上,也会有×,如果不想要改列,可以进行删除。

点击【清除工作表】。

将【负利润国家2】拖到【列】中,将【利润】拖到【行】中。可以看到集内外变化。

右击【负利润国家2】——【编辑集】,删除【市场】列,点击【应用】和【确定】。

发现图表无变化,因为【市场】列变化不影响数据。

右击【负利润国家2】——【编辑集】,删除【国家/地区】列,点击【应用】和【确定】。

发现数据发生变化。原因是细分市场里的【公司】和【消费者】变成了内,其他的细分市场变成了外。

创建动态数据集

新建工作表9。

右击【维度】下【产品名称】——【创建】——【集】。

修改集的名称,勾选【按字段】,选择【利润】【总和】【<=】【0】,点击【加载】,点击【确定】。

将【负利润产品】拖到【行】中,将【利润】拖到【列】中。

点击行中【内/外(负利润产品)】的下拉三角,选择【在集内显示成员】。

通过排序方式创建动态数据集

复制工作表9,【清除工作表】,这次找销量在前100的产品。

右击【维度】下【产品名称】——【创建】——【集】。

修改集名称,选择【顶部】,勾选【按字段】,选择【顶部】【100】【数量】【总和】,就是将销量按降序排序,取前100个。点击【确定】。

合并集

合并同一个维度的数据。

右击【负利润产品】——【创建合并集】。

修改集名称,左边是【负利润产品】,右边只能选择【销量TOP100】,因为两者都是从【产品名称】这个维度创建而来。

下面有四种选择:

  • 合并
  • 相交
  • 左交
  • 右交

选择相交,点击【确定】。

通过筛选器创建数据集

将【地区】拖到【筛选器】里,勾选【南亚】【西亚】【中亚】【东亚】【东南亚】,点击【确定】。

右击【筛选器】下的【地区】——【创建集】。

修改集名称,点击【确定】。

数据集用于分层结构

将【集】下【亚洲地区】拖到【维度】——【市场】上,弹出【创建分层结构】,修改分层名称,点击【确定】。


3.3使用集做对比分析

将【卖情怀的产品】拖到【行】,将【利润】拖到【列】。

选择【行】中【卖情怀的产品】的下拉三角——【在集内显示成员】。

点击【显示标记标签】,显示具体标签数值。