热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

高级的数据洞察力,如何培养?

文章看点:用通俗搞笑的例子,讲清楚了解读数据含义的方法

很多新人读不懂数据含义。对着报表,只会和复读机一样,叨叨:“昨天销量100,今天销量120,增加20……”讲这些只要不是瞎子都能看的到的东西。也因此经常被笑话,咋办?!今天我们系统讲解一下。

读懂第一阶段:明指标

给一个数字:180,能看出含义不?

不能!

因为这就是孤零零一个数字,啥含义都没有。想读懂数据,至少它得是一个明确的数据指标。包含了指标名称,使用场景,计算口径。同样是180,我们换成:成年女性,身高180cm。是不是一下清晰很多了。

读懂第二阶段:立标准

而且很多人可能已经有了本能的判断:这个女生个子很高。这么判断,可能基于数据统计。根据2015年《中国居民营养与慢性病状况报告》,报告显示,成年男性平均身高167.1cm,女性155.8cm,也就意味着180cm已经超过大量男性身高了。可以定义为高。这么判断,也可能基于约定俗成的习惯。比如习惯来说,女生超过170已经算高个了,180更是超大个。肯定算是高了。

两种判断都没有错,其实都是进一步读懂数据的方法:统计法和习惯法。统计法基于数据统计上的差异进行高中低划分。习惯法则是把人们约定俗成的习惯量化。

从“成年女性,身高180cm”到“成年女性,个子非常高”是读懂数据的一个重要转折。因为180cm是一个客观数值,不能直接影响我们决策。但是“高”是一个判断结果,这个判断是会影响我们决策的。不信继续往下看。

读懂第三阶段:合场景

场景1:小明身高175,二姨很热情的介绍了一个180的女生来给他相亲。

场景2:小明在组织一次展会活动,需要5名模特,HR linda介绍了1个180女生给他。

问两种场景下小明的心情如何?

有些女生会嫌弃比自己矮的男生,很不幸,小明就是被深深嫌弃过的一名靓仔。所以小明遇到场景1估计就直接骂娘了:“早就说了不要找比我高的,你丫是诚心给我难堪吗!”——这就是无视别人要求的结果。

场景2估计小明会很开心。展会的模特吗,就是要人高马大模样俏,这样才够排面。当然肯定出场费贵很多。这时候要是图便宜,随便找几个矮个子妹子,估计领导看到身高就要开骂了——给你们费用,不拿来贴门面,拿来擦屁股吗!

所以想再深度读懂数据,一定要结合具体场景。这里有两种做法:

1、基于业务逻辑推演

2、基于过往经验总结

两种方法,都需要对业务场景的深入了解(如下图):

读懂第四阶段:观态势

经过前三阶段,我们已知的信息是:

1、成年女性180cm属于:高

2、找模特需要个子:高

3、个子高+模样俏=价格贵

在这些基础上,再看数据,又会有新的解读。

比如你负责筹划展会,你下边的广告公司推荐的现场模特身高如下:

看完以后,你可能马上读出:这帮孙子又想黑我的费用!偷偷摸摸给我换了一批便宜的模特!是滴,这个解读就又比“诶呀,身高缩水这么多”更进一步,这就是第四阶段的解读。

同样的数据,如果你没有读出这个,直接发给了领导,领导看完可能立马解读出:这个新来的小伙子不懂业务呀,哪有排面活做的这么寒碜的。

同样的数据,如果领导没有处理,真的找了一批随便什么人去展会。你的经销商们看了以后,立马能解读出来:诶呀,今年这品牌实力是不是有问题呀,你看展台面积也缩水了,新品发布会也不热烈,模特都是凑数的,不行不行。

所有这些都是基于一个身高数据,所谓见微知著,其实背后都是有逻辑的推理(如下图)

读懂与瞎胡乱读的区别

当然,解读数据也是有限度的,过分解读,或者随便乱猜,都会导致错误理解。比如:

随便乱猜:你看模特都是美女,所以他们的老总肯定好色。

过度解读:你看这次请了九个美女模特,肯定有九款产品发布

读懂与随便乱猜的最大区别,就是证据数量。比如上边经销商质疑品牌商实力,并不只是孤零零的看模特身高变化,也看了展台、看了新品发布会,有多个证据支持,解读自然接近真实。随便乱猜常常是毫无依据(好色的证据呢?)过度解读,常常是孤证不立(除了九个模特,还有其他证据吗?)。

当然并不排除我们获得了更多证据以后,有个新的解读。逻辑性+证据数量,是判断数据解读的唯一标准。只要有充足的证据+合理的逻辑,我们就有理由接受结论。

为啥企业里解读数据很难

为啥例子里解读数据很容易,可实际工作中很难呢?答:因为身高、相亲、展会模特这些例子,本身业务含义非常简单清晰,容易懂。可实际工作里,数据分析师常常脱离业务,对具体销售、运营、产品、售后等等情况一无所知,只能通过:销售额,毛利、活跃率、转化率等几个数字做简单猜测。

常见的问题,比如:

不懂业务含义:为啥相亲要关注身高?不是看有没有感觉吗?

不懂业务情况:为啥小明不喜欢高个子女生?高个子才是靓女啊!

不懂业务逻辑:为啥展会一定要找高个子模特?随便去几个人不行吗?

这样导致的结果,是无从对数据下判断。于是只能流于:昨天销量120,今天140,增长20,增长了16.7%这种毫无意义的流水账。关键是,这些判断很有可能在业务看来是常识,所以在沟通中出现了:业务懒得说,数据不知道问,的尴尬场面。最后怪罪到数据分析师头上的时候,他还可怜巴巴的:我又没相过亲,我又没做过展会,呜呜呜

所以想解读的深入,具体,就得贴近业务,学会从具体操作中抽象出数据含义,将业务方的判断量化。

(加入数据工匠俱乐部知识星球获取更多资讯)


联系我们

扫描二维码关注我们


微信:DaasCai

邮箱:ccjiu@163.com

QQ:2286075659

热门文章


PPT,考验你的格局、能力和思维的方式,你得学会驾驭它!

那些不加班的人,都是怎么做Excel的?

从8个角度5分钟搞定数据仓库


商业银行数据分类分级的管理实践


数据架构管理的数字化与数字化管理


数据分析师的工作职责是什么?


如何用Excel表格制作品质图表?


如何用数据解决实际问题?


数据治理:让你效率迅速提升的10个Excel数据清理技巧


这篇文章把物料清单(BOM)各种场景讲透了

我们的使命:普及数据管理知识、发展数据管理工程师行业、改变中国企业数据管理现状、提高企业数据资产管理能力、推动企业走进大数据时代。

我们的愿景:凝聚行业力量、打造数据工程师全链条平台,培养不同层级数据工程师人才、构建数据工程师生态圈。

我们的价值观:分享数据管理知识,持续提升数据管理和运营能力。

了解更多精彩内容


长按,识别二维码,关注我们吧!

数据工程师

微信号:sjgcs

构建数据工程师生态圈



推荐阅读
  • 本文作者分享了在阿里巴巴获得实习offer的经历,包括五轮面试的详细内容和经验总结。其中四轮为技术面试,一轮为HR面试,涵盖了大量的Java技术和项目实践经验。 ... [详细]
  • 创邻科技成功举办Graph+X生态合作伙伴大会,30余家行业领军企业共聚杭州
    9月22日,创邻科技在杭州举办“Graph+X”生态合作伙伴大会,汇聚了超过30家行业头部企业的50多位企业家和技术领袖,共同探讨图技术的前沿应用与发展前景。 ... [详细]
  • 智慧城市建设现状及未来趋势
    随着新基建政策的推进及‘十四五’规划的实施,我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型,促进数字政府建设,新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计,以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]
  • 58同城的Elasticsearch应用与平台构建实践
    本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]
  • 国内BI工具迎战国际巨头Tableau,稳步崛起
    尽管商业智能(BI)工具在中国的普及程度尚不及国际市场,但近年来,随着本土企业的持续创新和市场推广,国内主流BI工具正逐渐崭露头角。面对国际品牌如Tableau的强大竞争,国内BI工具通过不断优化产品和技术,赢得了越来越多用户的认可。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 本文探讨了当前技术发展趋势,特别是大数据和人工智能如何推动工业互联网的发展。文章分析了全球主要国家在工业互联网领域的进展,并展望了未来工业互联网技术的发展方向。 ... [详细]
  • Apache IoTDB:开源工业物联网数据库的崛起
    2020年9月23日,全球领先的开源软件基金会——Apache软件基金会宣布,Apache IoTDB正式成为其顶级项目。Apache IoTDB是一款专为大规模物联网和工业物联网设计的开源数据库。 ... [详细]
  • Python库在GIS与三维可视化中的应用
    Python库极大地扩展了GIS的能力,使其能够执行复杂的数据科学任务。本文探讨了几个关键的Python库,这些库不仅增强了GIS的核心功能,还推动了地理信息系统向更高层次的应用发展。 ... [详细]
  • 自SQL Server 2005以来,微软的这款数据库产品逐渐崭露头角,成为企业级应用中的佼佼者。本文将探讨SQL Server 2008的革新之处及其对企业级数据库市场的影响。 ... [详细]
  • 顺丰速运(简称顺丰)长期以来以其快递服务闻名。然而,随着大数据和科技元素的不断融入,顺丰正逐步转变为一个科技驱动的企业,展现出全新的品牌形象。 ... [详细]
  • 本文由蕤内撰写,明亮公司出品,探讨了日本零售业在数字化转型中的现状与挑战。文章基于与两位在日本的投资人的深入对话,分析了日本零售业为何仍然依赖传统的POS机系统,以及中日两国在品牌建设和数字化营销上的差异。 ... [详细]
  • 单样本符号检验在国工数据大脑与LIMS系统融合中的应用
    探讨单样本符号检验如何在国工数据大脑与实验室信息管理系统(LIMS)中实现高效数据处理与分析,提升数据价值。 ... [详细]
  • 本文详细介绍了Python中的流程控制与条件判断技术,包括数据导入、数据变换、统计描述、假设检验、可视化以及自定义函数的创建等方面的内容。 ... [详细]
  • 探讨低代码行业发展现状,分析其未能催生大型企业的原因,包括市场需求、技术局限及商业模型等方面。 ... [详细]
author-avatar
弥囜_550
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有