第1节:字段设置
导读:本节内容具体包括四个知识点:
1拆分字段、合并字段
2创建文件夹和分层结构
3创建计算字段、组、集、参数、数据桶
4数据类型中的“地理角色”用法
所用数据:tableau自带的示例-超市数据
一、拆分字段(使用“拆分”菜单)
以订单ID为例,希望按照“-”将该字段进行分割
操作:
第一种:在数据源中选择订单ID上的小三角符号,选择下拉菜单中的“拆分”,
于是自动拆分为3列。于是在工作表中,也会新生成三个订单ID拆分的字段
第二种:在数据源中选择订单ID上的小三角符号,选择下拉菜单中的“自动拆分”
询问需要拆分成几列,若选择1列,则只保留第一个“-”前的那一列
若选择2列,则拆分成前两列;若选择3列,则和自动拆分的结果一致
第三种:在工作表中,选择“变换”,里面也有“拆分”和“自动拆分”两种选择
二、合并字段(在“计算字段”中使用“+”进行连接)
以类别和子类别为例,希望合并成为格式为“类别”-“子类别”的新字段
在工作表中,找到“类别”字段—右键“创建”—“计算字段”
在弹出的对话框中进行如下设置
于是,在字段区域就增加了“类别-子类别”的新字段
三、创建文件夹
在工作表中,字段区域的“维度”后面有一个搜索框(放大镜样式)可以实现模糊查找,但是如果字段很多,看起来还是很乱,所以需要创建文件夹,把同类字段放在同一个文件夹中,这样字段看起来更加清晰,更方便查找
从数据字段来看,目前这些字段可以分为地理位置、订单、产品、
操作
第一种:在工作表的空白区域右键“创建文件夹”—在弹出的对话框中输入需要创建的文件夹的名称—将该文件夹所属字段拖拽至该文件夹(或选该字段,右键文件夹——添加文件夹)。
第二种:确定哪些字段可以放在同一个文件夹,将这些字段按住
创建效果见下图
四、创建分层结构
创建分层结构的目的是为了进行上钻和下钻分析,以查找数据变化深层次的原因。
以地理位置为例,按照由大到小的顺序为“国家-地区-省/自治区-城市”
操作:
按
于是,可以得到如下图所示的分析效果
再比如,产品内的字段也有层级关系,即由大到小依次为“类别-子类别-制造商-产品名称”
请大家自己进行创建
五、创建计算字段
例如,希望计算利润率,利润率=利润/销售额,所以可以通过“利润”和“销售额”两个字段来进行创建。
操作:
在工作表的度量的空白区域内右键—创建计算字段,在弹出的对话框中进行如下设置:
注意,数据中的自有字段的前面是#,而我们自己计算出来的字段前面则是=#,对于计算的字段如果写错了,可以右键该字段,点击“编辑”,进行修改。
六、创建组
创建组就是对字段里的变量值进行归类,比如将“城市”这个字段归成“一线城市”和“其他城市”两类,就使用创建组。
操作:
在工作表中,右键“城市”——创建——组,于是弹出下面的对话框:
点击“查找”,在“查找成员”下的空白框中输入“北京”,点击“查找全部”,于是,找到“北京”—点击“分组”,于是就显示“北京”被分到一个名为“北京”的组,修改组名为“一线城市”
同理,查找“上海”,找到“上海”后,右键显示“添加到”(或在群组的后面选择添加到)—选择“一线城市”,于是“上海”也被归入
同理,把广州和深圳选入一线城市
然后其他所有城市都归入其他,具体操作为,在“包括“其他”“前面的方框中打对号,于是,其余所有城市被归入“其他”,将“其他”改为“其他城市”
于是完成了分组
点击右键,在字段区域就生成了城市分组字段,将其拖拽至工作表区域,就可以看到,它所包含的变量值就变成了两个:一线城市和其他城市。
并可以进行相应的分析,比如分析不同类别城市的销售额
七、创建集
集是指符合一定条件的对象,分成集合内和集合外。如果符合该条件,就是集合内,不符合该条件就是集合外。
例如,假设想设置一个集合为:利润排在前10名的客户。
操作:
选择“客户名称”字段,右键创建——集,于是弹出下面的对话框
将名称改为“利润排名TOPN客户”——选择“顶部”——按“字段”为顶部10(若选底部则表示排名倒数10名)——“利润”,“总和”——点击“确定”
如图所示
含义就是以利润总和为依据,找出利润总和为前10名的客户。
于是在“集”里就出现了“利润排名TOP10的客户‘,现在要看利润排名总和为前10名的客户和其他客户的销售额贡献情况,就可以做成下图所示的样子。其中内就表示利润排名总和为前10名的客户,而外则表示其他客户。
八、创建参数
如果想知道的客户是排名前N名,N会发生改变,比如前5名,前10名,此时要创建参数。
具体操作就是在前面操作的基础上,依据由10改为创建新参数,然后进行下图所示的操作:
(其中显示格式选择数字(标准)),点击确定
于是参数多了一个:利润排名前多少名的客户,并且在右侧增加了参数调节的显示框
可以通过调控进行显示。
九、创建数据桶
数据桶的意义在于方便后续制作直方图和条形统计图。
数据桶,其实就是把度量数据(即数值型的数据)分为几个区间,方便后续做直方图,也就是统计学中的分组数据,或者称为组距式。
如果说分类型数据的分段被称为“组“
那么数值型数据的分段被为“数据桶“
例如,将“利润“拖入行,点击”智能显示“——”直方图“(倒数第二行中间的图),就自动创建利润的数据桶。在左侧的字段区域内就生成了”利润(数据桶)“字段。
选中“利润(数据桶)“字段——右键”编辑“,弹出对话框
在该对话框中,数据桶的大小就是组距。其余的值范围都是默认的值,我们可以更改数据桶的大小,比如改为1000,点击确定,于是新的直方图的组距就变为了1000.
或者直接右键“利润“,也可以直接创建数据桶。比如,将数据桶的组距改成500,进行拖拽得到下图:
十、地图角色的设置
为了能在地图上显示,比如各个城市的销量有多大,需要对表示地理属性的字段进行“地图角色“的设置。在本例中,就是要设置”地点“文件夹中的字段
操作:
以国家为例,点击“国家“字段前面的图标,在弹出的列表中选择”地理角色“,各字段对应的地理角色如下:
字段 地理角色
国家 ——国家/地区
省/自治区 ——省/市/自治区
城市 ——城市
于是,他们前面都变成了地球的样子
双击两下“国家“字段,于是在右侧就会显示出国家地图
上图是国家。
如果将省/自治区放入到标记框内,中国地图上就会显示出表示各省市自治区的散点
同理,如果再将城市放入到标记框内,那么就会出现表示城市的散点。
学习笔记与数据文件链接:
https://pan.baidu.com/s/1oeDWW5BpCGLqcXfK_gqjgQ
提取码:xbpg
● SQL从入门到精通
● 想成为数据分析师,这些书必看!
● 不用敲代码,利用它就可以轻松爬取数据
发现更多精彩
关注公众号
你点的每个在看,我都认真当成了喜欢