热门标签 | HotTags
当前位置:  开发笔记 > 大数据 > 正文

产品日活DAU下降,我该如何着手分析?

写在最前:上一篇文章写的是用户增长的思考框架,但是其实我们大多数人在工作中都是只负责其中一小块,可能写一些具体的细分问题会对大家更有帮助。

写在最前:上一篇文章写的是用户增长的思考框架,但是其实我们大多数人在工作中都是只负责其中一小块,可能写一些具体的细分问题会对大家更有帮助。

故第二篇文章,我选择了一个具体的问题着手写。产品核心数据异常是在工作中经常会遇到的问题,也是常见的互联网面试问题。在此我结合网上的一些分享以及自己的经验,总结一些思考分析框架,让大家在遇到此类问题的时候有一个明确的着力点。

案例简介

   一款信息流APP平时日活稳定在79w-80w之间,但是在6月13日起突然掉到了78.8w,到6月15日已经掉到78.5w,这时产品负责人着急了,让你尽快排查一下数据下跌的原因。这样的问题对大多数人来说还是比较头疼的,因为对于80w量级的产品,一两万并不是一个非常大的波动,但原因还是要排查。拿到这个问题,会觉得不知道从哪点着手开始分析?没关系,我们把常用套路捋清楚了,然后回头再看这个案例。

核心点:

先做数据异常原因的假设,后用数据验证假设

不建议大家第一步先自己对着数据去拆,影响日活数据的因素很多,不可能把所有维度逐一拆解对比,容易浪费时间却没有任何有价值的发现。

做数据异常原因分析的核心就是结合以往经验及各种信息,找出最有可能的原因假设,通过数据的拆分进行多维度分析来验证假设,定位问题所在。过程中可能会在原假设基础上建立新的假设或者是调整原来假设,直到定位原因。

第一步:确认数据真实性

  在开始着手分析前,建议先确认数据的真实性。我们经常会遇到数据服务、数据上报、数据统计上的BUG,在数据报表上就会出现异常值。所以,找数据流相关的产品和研发确认下数据的真实性吧。

第二步:根据几个常见维度初步拆分数据

计算影响系数:每一项数据都要和以往正常值做对比,算出影响系数。

影响系数=(今日量-昨日量)/(今日总量-昨日总量)

影响系数越大,说明此处就是主要的下降点

以上是几种常见的初步拆分维度,通过初步拆分,定位原因大致范围。

第三步:异常范围定位后,进一步做假设

针对初步定位的影响范围,进行进一步的排查。分三个维度来做假设,建议针对数据异常问题专门建一个群,拉上相应的产品、技术、运营人员一起,了解数据异常时间点附近做了什么产品、运营、技术侧调整。

综合考虑以往数据异常原因、产品运营技术侧调整、初步定位的影响范围最可能由什么原因造成,再结合自身业务经验确定几个最可能的原因假设,给这些假设排数据验证的优先级,逐一排查。

最后:细分假设,确立原因

除了上述,可以细分分析的维度实在太多,逻辑上说核心点在于一个假设得到验证后,在这个假设为真的基础上,进行更细维度的数据拆分。我们需要记住这种分析方式,当猜测是某种原因造成数据异常时,只要找到该原因所代表的细分对立面做对比,就可以证明或证伪我们的猜测,直到最后找到真正原因。

案例分析

以上就是核心数据异常的分析套路,是不是刚才拿到问题还不知道从哪开始分析,现在觉得其实有很多点可以去着手?让我们回到刚才的案例吧。

根据上述套路,首先我们拆分新老用户活跃量,如下图(老用户左轴、新用户右轴):

  发现老用户日活较平稳,但是新用户自6月13日下降严重,于是计算新老用户影响系数:

老用户影响系数=(77.89-78)/(78.8-79.5)=0.16

新用户影响系数=(0.98-1.5)/(78.8-79.5)=0.84

新用户影响系数0.84,说明DAU下降是出在新用户身上,明确范围后进一部细分,新用户由什么构成?

新用户=渠道1+渠道2+渠道3+其他渠道 ,于是我们把新用户日活按渠道进行拆分:

  通过渠道拆分,我们发现渠道3自6月13日起新用户下降严重,于是我们把问题定位在渠道3,应该是渠道3的渠道效果发生问题。联系渠道3的负责人一起定位具体原因,渠道线索量降低?渠道转化率降低?渠道平台的问题?找出原因后,再针对原因解决问题,制定渠道优化策略。

最后要说的

至此本篇文章已到尾声,详细叙述了核心数据异常的分析套路以及讲了一个易于大家理解的小案例,相信大家下次再遇到这类问题,至少有一个明确的着手点。还有一些想对大家说的是:

  为了方便大家理解,这个小案例的数据是我虚构的,问题定位过程也比较简单。但是在实际业务中,数据异常的影响原因可能是多方面的(本篇只讲到了一些内部因素,外部环境和竞对其实也会影响核心数据),有的时候也需要建立统计分析模型来做一些定量分析。可能要花几天的时间去不断排查问题,这个过程繁琐且枯燥,假设验证失败可能会有挫败感,或许忙活了很久但是最后并没有找出原因。其实这是很正常的事情,数据异常分析甚至对于一个资深数据分析师都是一个令人头疼的问题。所以我们需要在平时工作中多留意数据变化,随着对业务的熟悉和数据敏感度的提升,针对数据异常分析我们也会越来越熟练,更快找到问题所在。

热门文章

直戳泪点!数据从业者权威嘲讽指南!

AI研发工程师成长指南

数据分析师做成了提数工程师,该如何破局?

算法工程师应该具备哪些工程能力

数据团队思考:如何优雅地启动一个数据项目!

数据团队思考:数据驱动业务,比技术更重要的是思维的转变


推荐阅读
  • 腾讯安全平台部招聘安全工程师和数据分析工程师
    腾讯安全平台部正在招聘安全工程师和数据分析工程师。安全工程师负责安全问题和安全事件的跟踪和分析,提供安全测试技术支持;数据分析工程师负责安全产品相关系统数据统计和分析挖掘,通过用户行为数据建模为业务决策提供参考。招聘要求包括熟悉渗透测试和常见安全工具原理,精通Web漏洞,熟练使用多门编程语言等。有相关工作经验和在安全站点发表作品的候选人优先考虑。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 从零基础到精通的前台学习路线
    随着互联网的发展,前台开发工程师成为市场上非常抢手的人才。本文介绍了从零基础到精通前台开发的学习路线,包括学习HTML、CSS、JavaScript等基础知识和常用工具的使用。通过循序渐进的学习,可以掌握前台开发的基本技能,并有能力找到一份月薪8000以上的工作。 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • PHP组合工具以及开发所需的工具
    本文介绍了PHP开发中常用的组合工具和开发所需的工具。对于数据分析软件,包括Excel、hihidata、SPSS、SAS、MARLAB、Eview以及各种BI与报表工具等。同时还介绍了PHP开发所需的PHP MySQL Apache集成环境,包括推荐的AppServ等版本。 ... [详细]
  • 近年来,大数据成为互联网世界的新宠儿,被列入阿里巴巴、谷歌等公司的战略规划中,也在政府报告中频繁提及。据《大数据人才报告》显示,目前全国大数据人才仅46万,未来3-5年将出现高达150万的人才缺口。根据领英报告,数据剖析人才供应指数最低,且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示,未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中,60%以上的招聘职位都是针对大数据人才的。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了C#中生成随机数的三种方法,并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法,但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数,进一步突显了这个问题。文章指出,随机数生成在任何编程语言中都是必备的功能,但Random类生成的随机数并不可靠。最后,提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]
  • qt学习(六)数据库注册用户的实现方法
    本文介绍了在qt学习中实现数据库注册用户的方法,包括登录按钮按下后出现注册页面、账号可用性判断、密码格式判断、邮箱格式判断等步骤。具体实现过程包括UI设计、数据库的创建和各个模块调用数据内容。 ... [详细]
  • 硬科技投资时代,投资者们该如何抉择?
    随着越来越多符合国家战略、市场认可度高、突破关键核心技术的科技创新型企业挂牌上市,硬科技投资越来越热。华夏中证科创创业50ETF联接基金的开售为投资者提供了新的选择。硬科技的发展有助于突破“卡脖子”技术、实现进口替代,以及推动产业升级。在硬科技投资时代,投资者们应该如何抉择? ... [详细]
author-avatar
NewGuy
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有