大部分小伙伴会认为,数据是真实可信的,但很多时候,事实并非如此。想要做好一份数据分析,需要规避一些常见误区,下面和黑马君一起来学习吧~ 强烈建议点击收藏哦!
其实数据也会骗人,举个例子,二战时英军发现从战场飞回来的战机,机身上的弹孔比引擎和油箱上的要多得多,根据这个数据很容易得出要加强机身的防护的建议。但事实的真相是引擎和油箱上中弹的飞机已经回不来了更应加强引擎和油箱的防护,这就是常说的“幸存者偏差”。
数据可能被人为操纵。如店铺的评论,如电影的评分,如某公司发布的关于其所在行业的分析报告都具有一定的主观性。
基于错误的数据做出的分析结论是无益甚至是有害。在数据分析前先要考证数据的来源及可信度还要关注不符合常理的数据变化,对数据采集方法进行调整。
对于业务决策来说数据分析只是辅助手段,而不是核心推动力。许多数据是无意义的,过度依赖数据于决策无益甚至会引导上级做出错误的决策。
在书籍《大数据时代》中,提到了这样一种情况:玛丽莎·迈尔在任谷歌高管期间,有时会要求员工测试41种蓝色的阴影效果,哪种被人们使用最频繁从而决定网页工具栏的颜色。这是陷入“数据之上”的误区,这样的数据是毫无意义,访客能不能看出细微的差别不说,几乎没有人会因为阴影效果的不同而决定访问/不访问这一网页。
一份靠谱的分析结论既来源于对关键数据的分析来源于经验的积累,来源于分析师对业务的认识。如果简单地把论证过程简单地简化为数据分析过程事实上是一种偷懒行为。
数据分析初学者极易犯的错误,只懂技术不懂业务不能真正理解业务需求。很多新手认为工作中只需要勤勤恳恳敲代码就行,无数SQL boy/girl就这么诞生。好的分析师既懂技术又懂业务。因为技术为业务服务,公司衡量技术的价值不在于分析技术有多高超而是对业务有没有贡献。
数据分析师也要多去一线了解业务运作,帮助解决业务运营中遇到的各种问题。除了深入了解业务,还需要积累丰富的数据分析模型库以应对各种业务场景,比如金字塔模型、KANO分析模型、RFM模型、购物篮分析模型、四象限模型…这些经典且广泛应用的模型。
数据分析是整个商业活动的一环,而商业是追求效率的。很多新人容易陷入追求完美算法的陷阱,放着简单的方案不用,非要花大量时间在钻数据算法的牛角尖上,最后交出一份领导懒得看的长文报告。
对企业来说,这样的工作态度并不可取。推动分析结论落地是数据分析价值的体现,数据分析师除了要用最具效率的算法,还需要拿出让决策层和执行层都信服的分析报告。
在数据分析学习时或许习惯了各种解题套路,但实操时其实并不存在通用的分析套路。不同的行业、不同的业务,不同的阶段,哪怕用的是同一种分析方法结论都应有所区别。
对待每一次分析,应该结合业务场景中思考,结论要有针对性,不能被套路束缚住,也不能简单依赖过往的类似案例。
大数据时代,企业的数据体量不断扩大,业务需求不断变化数据分析的环境也不断变化。要实时更新知识和工具库也要警惕和避免踩中上面这些数据分析的误区。