热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

高级的数据洞察力,如何培养?

文章看点:用通俗搞笑的例子,讲清楚了解读数据含义的方法

很多新人读不懂数据含义。对着报表,只会和复读机一样,叨叨:“昨天销量100,今天销量120,增加20……”讲这些只要不是瞎子都能看的到的东西。也因此经常被笑话,咋办?!今天我们系统讲解一下。

读懂第一阶段:明指标

给一个数字:180,能看出含义不?

不能!

因为这就是孤零零一个数字,啥含义都没有。想读懂数据,至少它得是一个明确的数据指标。包含了指标名称,使用场景,计算口径。同样是180,我们换成:成年女性,身高180cm。是不是一下清晰很多了。

读懂第二阶段:立标准

而且很多人可能已经有了本能的判断:这个女生个子很高。这么判断,可能基于数据统计。根据2015年《中国居民营养与慢性病状况报告》,报告显示,成年男性平均身高167.1cm,女性155.8cm,也就意味着180cm已经超过大量男性身高了。可以定义为高。这么判断,也可能基于约定俗成的习惯。比如习惯来说,女生超过170已经算高个了,180更是超大个。肯定算是高了。

两种判断都没有错,其实都是进一步读懂数据的方法:统计法和习惯法。统计法基于数据统计上的差异进行高中低划分。习惯法则是把人们约定俗成的习惯量化。

从“成年女性,身高180cm”到“成年女性,个子非常高”是读懂数据的一个重要转折。因为180cm是一个客观数值,不能直接影响我们决策。但是“高”是一个判断结果,这个判断是会影响我们决策的。不信继续往下看。

读懂第三阶段:合场景

场景1:小明身高175,二姨很热情的介绍了一个180的女生来给他相亲。

场景2:小明在组织一次展会活动,需要5名模特,HR linda介绍了1个180女生给他。

问两种场景下小明的心情如何?

有些女生会嫌弃比自己矮的男生,很不幸,小明就是被深深嫌弃过的一名靓仔。所以小明遇到场景1估计就直接骂娘了:“早就说了不要找比我高的,你丫是诚心给我难堪吗!”——这就是无视别人要求的结果。

场景2估计小明会很开心。展会的模特吗,就是要人高马大模样俏,这样才够排面。当然肯定出场费贵很多。这时候要是图便宜,随便找几个矮个子妹子,估计领导看到身高就要开骂了——给你们费用,不拿来贴门面,拿来擦屁股吗!

所以想再深度读懂数据,一定要结合具体场景。这里有两种做法:

1、基于业务逻辑推演

2、基于过往经验总结

两种方法,都需要对业务场景的深入了解(如下图):

读懂第四阶段:观态势

经过前三阶段,我们已知的信息是:

1、成年女性180cm属于:高

2、找模特需要个子:高

3、个子高+模样俏=价格贵

在这些基础上,再看数据,又会有新的解读。

比如你负责筹划展会,你下边的广告公司推荐的现场模特身高如下:

看完以后,你可能马上读出:这帮孙子又想黑我的费用!偷偷摸摸给我换了一批便宜的模特!是滴,这个解读就又比“诶呀,身高缩水这么多”更进一步,这就是第四阶段的解读。

同样的数据,如果你没有读出这个,直接发给了领导,领导看完可能立马解读出:这个新来的小伙子不懂业务呀,哪有排面活做的这么寒碜的。

同样的数据,如果领导没有处理,真的找了一批随便什么人去展会。你的经销商们看了以后,立马能解读出来:诶呀,今年这品牌实力是不是有问题呀,你看展台面积也缩水了,新品发布会也不热烈,模特都是凑数的,不行不行。

所有这些都是基于一个身高数据,所谓见微知著,其实背后都是有逻辑的推理(如下图)

读懂与瞎胡乱读的区别

当然,解读数据也是有限度的,过分解读,或者随便乱猜,都会导致错误理解。比如:

随便乱猜:你看模特都是美女,所以他们的老总肯定好色。

过度解读:你看这次请了九个美女模特,肯定有九款产品发布

读懂与随便乱猜的最大区别,就是证据数量。比如上边经销商质疑品牌商实力,并不只是孤零零的看模特身高变化,也看了展台、看了新品发布会,有多个证据支持,解读自然接近真实。随便乱猜常常是毫无依据(好色的证据呢?)过度解读,常常是孤证不立(除了九个模特,还有其他证据吗?)。

当然并不排除我们获得了更多证据以后,有个新的解读。逻辑性+证据数量,是判断数据解读的唯一标准。只要有充足的证据+合理的逻辑,我们就有理由接受结论。

为啥企业里解读数据很难

为啥例子里解读数据很容易,可实际工作中很难呢?答:因为身高、相亲、展会模特这些例子,本身业务含义非常简单清晰,容易懂。可实际工作里,数据分析师常常脱离业务,对具体销售、运营、产品、售后等等情况一无所知,只能通过:销售额,毛利、活跃率、转化率等几个数字做简单猜测。

常见的问题,比如:

不懂业务含义:为啥相亲要关注身高?不是看有没有感觉吗?

不懂业务情况:为啥小明不喜欢高个子女生?高个子才是靓女啊!

不懂业务逻辑:为啥展会一定要找高个子模特?随便去几个人不行吗?

这样导致的结果,是无从对数据下判断。于是只能流于:昨天销量120,今天140,增长20,增长了16.7%这种毫无意义的流水账。关键是,这些判断很有可能在业务看来是常识,所以在沟通中出现了:业务懒得说,数据不知道问,的尴尬场面。最后怪罪到数据分析师头上的时候,他还可怜巴巴的:我又没相过亲,我又没做过展会,呜呜呜

所以想解读的深入,具体,就得贴近业务,学会从具体操作中抽象出数据含义,将业务方的判断量化。

(加入数据工匠俱乐部知识星球获取更多资讯)


联系我们

扫描二维码关注我们


微信:DaasCai

邮箱:ccjiu@163.com

QQ:2286075659

热门文章


PPT,考验你的格局、能力和思维的方式,你得学会驾驭它!

那些不加班的人,都是怎么做Excel的?

从8个角度5分钟搞定数据仓库


商业银行数据分类分级的管理实践


数据架构管理的数字化与数字化管理


数据分析师的工作职责是什么?


如何用Excel表格制作品质图表?


如何用数据解决实际问题?


数据治理:让你效率迅速提升的10个Excel数据清理技巧


这篇文章把物料清单(BOM)各种场景讲透了

我们的使命:普及数据管理知识、发展数据管理工程师行业、改变中国企业数据管理现状、提高企业数据资产管理能力、推动企业走进大数据时代。

我们的愿景:凝聚行业力量、打造数据工程师全链条平台,培养不同层级数据工程师人才、构建数据工程师生态圈。

我们的价值观:分享数据管理知识,持续提升数据管理和运营能力。

了解更多精彩内容


长按,识别二维码,关注我们吧!

数据工程师

微信号:sjgcs

构建数据工程师生态圈



推荐阅读
  • 在前一篇文章《Hadoop》系列之“踽踽独行”(二)中,我们详细探讨了云计算的核心概念。本章将重点转向物联网技术,全面解析其基本原理、应用场景及未来发展前景。通过深入分析物联网的架构和技术栈,我们将揭示其在智能城市、工业自动化和智能家居等领域的广泛应用潜力。此外,还将讨论物联网面临的挑战,如数据安全和隐私保护等问题,并展望其在未来技术融合中的重要角色。 ... [详细]
  • 智能制造数据综合分析与应用解决方案
    在智能制造领域,生产数据通过先进的采集设备收集,并利用时序数据库或关系型数据库进行高效存储。这些数据经过处理后,通过可视化数据大屏呈现,为生产车间、生产控制中心以及管理层提供实时、精准的信息支持,助力不同应用场景下的决策优化和效率提升。 ... [详细]
  • 修复一个 Bug 竟耗时两天?真的有那么复杂吗?
    修复一个 Bug 竟然耗费了两天时间?这背后究竟隐藏着怎样的复杂性?本文将深入探讨这个看似简单的 Bug 为何会如此棘手,从代码层面剖析问题根源,并分享解决过程中遇到的技术挑战和心得。 ... [详细]
  • 2021年度回顾与深度分析
    2021年度回顾与深度分析 ... [详细]
  • 本文推荐了六款高效的Java Web应用开发工具,并详细介绍了它们的实用功能。其中,分布式敏捷开发系统架构“zheng”项目,基于Spring、Spring MVC和MyBatis技术栈,提供了完整的分布式敏捷开发解决方案,支持快速构建高性能的企业级应用。此外,该工具还集成了多种中间件和服务,进一步提升了开发效率和系统的可维护性。 ... [详细]
  • 【Linux进阶指南】第一阶段第三课:体验与部署Ubuntu系统
    在正式踏上Linux学习之旅之前,本课程将引导你深入体验和部署Ubuntu系统。通过详细的操作步骤和实践演练,你将掌握Ubuntu的基本安装、配置及常用命令,为后续的进阶学习打下坚实的基础。此外,课程还将介绍如何解决常见问题和优化系统性能,帮助你更加高效地使用Ubuntu。 ... [详细]
  • MemFireDB 在实时高并发的在线事务处理(OLTP)系统中表现出色。随着移动互联网、电商和社交应用等领域的迅猛发展,传统单机关系型数据库(如MySQL)或分库分表架构已难以满足日益增长的性能需求。MemFireDB 通过其高效的内存计算能力和灵活的分布式架构,能够显著提升系统的响应速度和处理能力,确保在高负载情况下依然保持稳定性和可靠性。此外,MemFireDB 还支持复杂的查询操作和事务管理,适用于需要高性能和低延迟的应用场景。 ... [详细]
  • PHP中元素的计量单位是什么? ... [详细]
  • 如何在Oracle ASM_Diskgroup中重命名现有磁盘
    如何在Oracle ASM_Diskgroup中重命名现有磁盘 ... [详细]
  • 稳操胜券,35K薪资,字节跳动商业数据分析岗位
    在数字化浪潮中,掌握数据即掌握未来。正如马云在IT领袖峰会上所言:“未来的竞争将是数据的竞争,只有实现业务的数据化和数据的业务化,企业才能在激烈的市场竞争中脱颖而出。”字节跳动的商业数据分析岗位,正是这一趋势的体现,提供35K的薪资,吸引着众多数据精英。 ... [详细]
  • 从用户转型为开发者:一场思维升级的旅程 | 专访 StarRocks Committer 周威
    从用户转变为开发者,不仅是一次角色的转换,更是一场深刻的思维升级之旅。本次专访中,StarRocks Committer 周威分享了他如何在这一过程中逐步提升技术能力与思维方式,为开源社区贡献自己的力量。 ... [详细]
  • 嘉年华回顾:樊文凯深入解析 Oracle 数据库异构迁移上云的最佳实践方案
    在2020年数据技术嘉年华即将开幕之际,我们特别推出“嘉年华回顾”系列,精选历届大会中的热门演讲内容。本次回顾中,樊文凯将深入解析 Oracle 数据库异构迁移上云的最佳实践方案,分享其在实际应用中的关键技术和成功案例,帮助企业和技术人员更好地应对云迁移过程中的挑战。 ... [详细]
  • 魅族Flyme 7正式发布:全面解析与亮点介绍
    在22日晚的发布会上,魅族不仅推出了m15、15和15 Plus三款新机型,还正式发布了全新的Flyme 7系统。Flyme 7在保持流畅体验的基础上,进一步增强了功能性和实用性,为用户带来更加丰富的使用体验。首批适配包已准备就绪,将逐步推送给现有设备。 ... [详细]
  • 2019年斯坦福大学CS224n课程笔记:深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析
    本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理(NLP)领域的应用,重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析,深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]
  • ZeroMQ在云计算环境下的高效消息传递库第四章学习心得
    本章节深入探讨了ZeroMQ在云计算环境中的高效消息传递机制,涵盖客户端请求-响应模式、最近最少使用(LRU)队列、心跳检测、面向服务的队列、基于磁盘的离线队列以及主从备份服务等关键技术。此外,还介绍了无中间件的请求-响应架构,强调了这些技术在提升系统性能和可靠性方面的应用价值。个人理解方面,ZeroMQ通过这些机制有效解决了分布式系统中常见的通信延迟和数据一致性问题。 ... [详细]
author-avatar
弥囜_550
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有