不仅数据分析师的招聘中要求具备可视化,和使用PPT制作分析报告的技能。对于非数据分析师的岗位,例如产品、市场、运营等,每天也会接触大量的图表。学习和工作中,很多想法都需要利用图表与领导沟通。
今天我们就来聊聊如何看懂图表。
1.图表中的6种元素
图表元素一般包括6项:
第1个是图表标题,用于介绍图表的主题;
第2个是横轴纵轴标题;
第3个是类别名称;
第4个图例:用各种符号和颜色代表图形里的不同类别;
第5个是网格线,方便看到每个元素大概在图形中哪个部分;
第6个是数据来源:赋予数据可信度。
为了图表精简,这6个元素不必要所有都用上。
下面图片中的图表数据来源:TalkingData移动数据研究中心的《招聘类APP用户人群洞察报告》,数据周期:217年12月-2018年3月。后面涉及设计到的招聘类APP图表都来自这个数据分析报告。
2.表格
因为我们常说的图表就是:图形+表格。当我们想展示排名前几的产品名称时,用表格可以很方便的展示给用户。下面图片中的表格是排名前10的招聘类APP。
从表格中我们可以看出,2018年2月,传统综合招聘平台代表-智联招聘、前程无忧51job的APP应用活跃指数以较大领先优势居于招聘类APP前两位。
虽然Boss直聘、猎聘同道、拉钩等平台主打高端人才招聘、互联网人才招聘等细分定位,但是在用户规模上仍然难以与传统综合平台竞争。
所以我们可以得出的数据结论是,传统综合招聘平台在用户规模上仍居于领先。
之前社群会员给我发求助问题,说自己在拉勾网上投简历,连个面试机会都没有。这其实就是忽略了传统综合招聘平台。我给他的建议是同时在综合招聘平台智联招聘、前程无忧51job上投简历,很快就收到了面试通知,这位社群会员现在已经成功拿到58同城的数据分析师offer。
使用表格时需要记住一点,要让设计融入背景,让数据占据核心地位。不要让厚重的边框和阴影与数据争夺用户的注意力。相反,使用窄边框或者干脆去掉边框,来突出数据。
3. 4种常见的图形
我把经常使用的图形分为4类:散点图、折线图、柱状图、条形图。其他很多图形都是从这4种类型衍化而来的。不管是经济学,还是在数据分析报告中,我们经常会看到这4种常见的图形。
1)散点图
假如我们想知道学生为某门考试花费的学习时间和考试成绩这两个变量的关系。如果我们将这个数据集放到一个二维表格里,是无论如何也没办法发现这两个变量之间有什么关系的。
我们可以把每个学生的数据绘制成点放到图中,其中每个点的横坐标值是横轴x上的考试花费时间,点的纵坐标的值是纵轴y考试分数。这样的图就叫做散点图,散点图可以显示出数据之间的相关性。
当我们想知道两个指标互相之间有没有关系,散点图是最好的工具之一。因为它直观。尤其是大数据量,散点图会有更精准的结果。在回归分析中我们经常会用到散点图。
2)折线图
对于时间序列的数据,我们用折线图来可视化,也就是用线条将相关的数据点相连,帮助我们用肉眼观察随着时间变化,数据是如何变化的趋势。
下面图片是春节假期前,招聘类APP周活跃率保持在一个稳中有降的状态。春节假期后,随着“金三银四”人才招聘高峰期的临近,招聘类APP周活跃率进入了一个爆发增长期,用户规模最大的智联招聘、前程无忧51job增长态势尤其明显。
3)柱状图
对于分类数据这种离散数据,需要查看数据是如何在各个类别之间分布的,这时候就可以使用柱状图。我们为每个类别画出一个柱子。
柱状图可以有一组或多种多组数据类别里对比。下面图片中对比了三个招聘类APP用户,其中智联招聘、猎聘同道APP用户更多集中在三线及以下城市。而拉勾APP一线城市用户占比接近40% 。
以后你找工作,就要根据自己的城市选择合适的招聘APP来投简历。
柱形图还有许多丰富的应用。
堆积柱状图不仅能比较各类别总体区别,还能同时还能看出每个类别中子成分的占比情况。但这种图形会让用户产生视觉上的压力。因为除了底部的子成分(也就是紧贴x轴的那个子成分),你很难比较其他子成分,这让肉眼比较变得很困难。
瀑布图可用于抽离出堆叠柱状图中的一部分重点关注,或者展示起点和结果以及其中的上升下降等变化。
下图中的瀑布图例子,用于展示过去一年中公司职员总数的变化情况。
在图的左侧,我们可以看到年初这个团队的职员总数。从左到右,我们首先看到数据的提升:新招聘以及从组织的其他团队转岗来的职员。之后数据减少:转岗到别的团队或是离职。最后一列代表了在年初基础上增减之后的年末职员总数。
直方图是柱形图的特殊形式,当我们想要看数据集的分布情况时,选择直方图。直方图的变量划分至不同的范围,然后在不同的范围中统计计数。在直方图中,柱子之间的连续的,连续的柱子暗示数值上的连续。
下图中的直方图可以显示出男性身高数据集的分布呈现正态分布。横轴是身高,以5厘米为单位。纵轴是每一段5厘米各有多少人。
4)条形图
条形图就是将竖直的柱状图翻转90度得到的图形。与柱状图一样,条形图也可以有一组或多种多组数据。
下面图片是移动大数据服务商极光大数据《2017第2季度app榜单》显示前10名的app。
如果非要为分类数据挑选一种图形,那就是条形图。为什么呢?
首先,条形图非常容易阅读。水平条形图在类别名称很长的时候非常方便,因为文字是从左到右书写的,与大多数用户的阅读顺序一致,这使得你的图形容易阅读。而柱状图在类别名称很长的时候是没有办法很好的展示的。
其次,由于我们处理信息的方式是从左上角开始,在页面或者屏幕上画“之”字,这正是水平条形图的结构。我们会在实际数据之前先看到类别的名称。这意味着当我们看到数据时已经了解了其所代表的含义,不像竖直柱状图那样在数据和类别名称之间来回转动眼球。
条形图还有许多丰富的应用。例如堆积条形图。堆积条形图和堆积柱状图类似,堆积条形也可以展示不同类别间整体或者子成分的比较。
如果左右端有着一致的基线,堆叠条形图可以用于可视化对一件事情从负面到正面的观点占比,使得比较最左侧和最右侧的部分变得更简单。例如下图中收集的调查问卷数据进行可视化。
现在我们已经了解了4种常见的图形,下面图片我们看下由这4种类型演化出来的其他图形类型。
4.其他图形
饼图
饼图是用面积表示一组数据的占比。下图是我公众号(猴子聊人物)中对不同渠道阅读文章占比的饼图。
需要注意的是,我们要避免使用饼图,因为人眼不擅长在二维空间进行定量的度量,这使得这类图表很难阅读。当饼图的各部分大小相近时,你很难判断哪一块更大。比如20%和25%在饼图上凭肉眼是难以分辨出区别的。
所以,饼图应该避免使用。
箱线图
箱线图用来展示数据集的描述统计信息,也就是四分位数。线的上下两端表示某组数据的最大值和最小值。箱子的上下两端表示这组数据中排在前25%位置和75%位置的数值。箱中间的横线表示中位数。
下图的箱线图是对不同工作经验的薪酬比较。横轴是工作年限,纵轴是薪酬。通过比较数据,我们可以看出随着年份上升,薪资待遇的上升也是非常明显的,尤其是3-5年这一段,提升的跨度非常之大。另外,从现有数据来看,数据分析师似乎是个常青的职业方向,在10年内大概不会因为年龄的增长导致收入下降。
再比如你是一位互联网电商分析师,你想知道某商品每天的卖出情况:该商品被用户最多购买了几个,大部分用户购买了几个,用户最少购买了几个。箱线图就能很清晰的表示出上面的几个指标以及变化。
热力图
热力图是用高亮形式展现数据。下图是智联招聘APP和拉勾APP用户在北京的工作地点。从图中高亮红色的区域,我们可以看出智联招聘APP用户北京工作地在全市范围内均有分布,而拉勾APP用户在北京工作地更多的集中在中关村、上地、望京、国贸等互联网企业密集区域。
我们生活中最常见的例子就是用热力图表现道路交通状况,老司机一眼就知道哪些路段拥堵,哪些路段顺畅,从而选择合适的开车路线。
互联网产品中,热力图可以用于网站/APP的用户行为分析,将用户浏览、点击、访问页面最多的位置以高亮的可视化形式表现。从而根据用户行为改善网页、APP的设计。
雷达图
雷达图在商务、财务领域应用较大,适合用在固定的框架内表达某种已知的结果。因为这个图形像雷达(图)的放射波,而且具有指引经营“航向”的作用,所以叫做雷达图。
下图是三个招聘类APP用户中,猎聘同道APP用户更加偏好个户美容、汽车、健康、家具等类型应用,对于个人生活品质要求更高。拉勾APP用户对于母婴类应用兴趣要远低于其他两个APP用户。比起孩子,拉勾APP用户更关注房产,租房、买房是他们的重心所在。
词云图
词云图是对数据集中出现频率较高的“关键词”给予视觉上的突出,从而过滤掉大量的文本信息,使用户只要一眼扫过文本就可以看到出现频率较高的关键词。
下图是从招聘网站爬取的公司对数据分析师的技能要求关键词,用这些关键词我们做出词云图。通过词云图,我们发现公司需求频率最高的技能是表格神器Excel和查询语言SQL,这一点需要各位小伙伴注意,如果要想从事数据分析师岗位,SQL和Excel看起来是必备技能。
漏斗图
漏斗图经常用来做用户转化率的可视化,其中最著名的就是硅谷用户增长专家肖恩·埃利斯在他的书《增长黑客—如何低成本实现爆发式成长》中提出的AARRR漏斗模型。
这个模型对应的分别是5个过程:Acquisition(获取用户),Activation(激活用户),Retention(提高留存),Revenue(增加收入),Referral(病毒传播)。
这套体系模型也不仅适用于互联网行业,它也可以应用到面向大众消费者的各个行业中,帮助业务成长,实现经济增长。下面我们分别看下这个漏斗图中的每个部分。
1)Acquisition(获取用户)
这个环节用一句话来概括就是:用户如何找到我们?
在互联网行业中,很多创业公司死掉并不是因为他们的业务或产品不行,而是因为他们的获客成本很高,并且没有办法降下来。肖恩最初在硅谷的云存储业务的创业公司Dropbox工作。这家公司开始时每获得一名用户的成本高达400美元,而它提供的付费服务每年是99美元。
肖恩对低成本获客,提供了两个建议:一是语言——市场匹配,就是你怎么说才能打动用户的心;二是渠道——产品匹配,就是在哪儿亮相才能吸引用户的目光。
语言——市场匹配,实际上考验的是抓住用户注意力的能力。现在人们关注一条网络信息的时间通常是8秒,如果不能在8秒内告诉用户你的产品对他有什么用,你就失去了一次获客的机会。
2001年iPod问世时,乔布斯完全可以在他传达的内容中解释为何他的播放器与众不同,性能更加优越,但他没有这样做。他明智地决定不使用任何形容MP3播放器功能的表述。他只用了一个简单而迷人的句子——“将1000首歌放在你的口袋里”,就彻底重塑了人们对便携式播放器魅力的认知。
而渠道——产品匹配是说产品投放在什么渠道才能直达用户的视线范围。如果你是一款为企业服务的软件,在娱乐网站打广告就非常不合适。
渠道可以分为三类,一种是口碑渠道,适合病毒营销;一种是有机渠道,适合搜索引擎优化、内容营销;还有一种是付费渠道,比如电视广告、赞助等。
2)Activation(激活用户)
这个环节用一句话来概括,就是用户的首次体验如何?
很多手机应用,注册用户不少,但是打开率不高。你要做的是激活他们,让他们真正地使用产品。
想唤醒休眠用户,就得先摸清楚产品的“啊哈时刻”(Ahamoment)。什么叫“啊哈时刻”呢?
说白了就是让用户感受到产品亮点情不自禁地发出赞叹的时刻,它对应的就是打动用户的产品亮点。比如网易云音乐,在众多音乐软件中突围的亮点就是评论,用户打开软件,可能第一件事不是听歌,而是看评论,心里面会有一些赞叹。
要想激活用户,得绘制一幅通往“啊哈时刻”的路线图。比如你负责的产品是个购物软件,在新用户体验到啊哈时刻之前,必须要完成下面这些步骤:下载app,找到所需商品,放入购物车,创建账户,输入姓名,加入信用卡和配送信息,然后点击购买。在这一系列动作中,到底用户停留在了哪一步?是搜不到要的东西,还是创建账户太麻烦,或者是页面设置不合理?你要计算每个节点用户的损失率,来相应地提高产品性能,改善用户体验。
接下来,你可以通过游戏化的做法,给用户奖励,比如打卡、积分。你还可以通过触发物,唤醒用户,比如推送信息等。这些都需要反复的试验,才能找到最有效的激活方法。这方面得到app就做的不错,可以作为案例研究。
3)Retention(提高留存)
第三个环节是留存。也就是用户会回来吗?
在前面第2个环节用户终于被唤醒了,这时候你的任务就变成了如何让用户变成回头客。留存的核心目标是让用户养成使用习惯。
在这个阶段,你要明白习惯是如何形成的。这里有一个经典的案例,就是亚马逊的会员服务。在刚推出时,许多分析人士都说这个计划必定会失败,因为美国的配送成本是很高的,而99美元的会员服务给会员免费配送一年,亚马逊肯定会亏。但亚马逊的真正目标是改变人们的习惯,让他们在购物中习惯会员优惠价格,习惯免运费,从而不再去其他家买东西。
留存用户根据初期、中期和长期阶段有不同的做法,增长黑客可以通过分组来观察,并持续提供实际回报来留住用户。
有段时间Facebook发现自己用户流失得很厉害,之前注销账号的确认页面有一段提示:你是不是要注销啊,你确认下,你再多确认一下,OK你去意已决那就给你注销。
后来Facebook改变了下确认页面,在注销结束之前增加了一个页面。这个页面它会把跟你互动比较亲密的五个朋友头像列出来,然后配上文字说:你确定你要注销嘛?你如果要注销的话,这些人再也看不到你了,你也再也关注不了这些朋友的新的情况了,你是不是要再考虑一下?
就是这个东西增加了3%的留存可能,相当于Facebook一年有三百万个流失就这样被避免掉了。
4)Revenue(增加收入)
也就是如何赚到更多钱?
完成了上面所有的步骤,终于来到最有挑战性的一关,那就是如何从用户身上获得真正的收益。比如让用户续订、创造更多的广告位等等。
虽然商业模式不同,变现的方式不同,但是有一个概念需要重视,那就是夹点(pinchpoint),它指的是损失潜在收益的地方。对于电商企业来说,用户从挑选商品到完成购买之间是一个危险区,很多人中途会放弃购买。增长团队要评估这些常见夹点,分析用户在这些点放弃的原因。
5)Referral(病毒传播)
用一句话来概括就是:用户会告诉他人吗?
比如这次薛兆丰菜市场经济学,下面几张海报的目的就是让用户分享到朋友圈,从而让更多的让看到这个活动,实现病毒传播效果。