热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

SQL新用户留存分析

表:用户登录日期区间表:dws.app_user_act_rng(2020-09-04)前一天其中9999-12-31代表

表:

用户登录日期区间表:dws.app_user_act_rng(2020-09-04)前一天

其中9999-12-31代表计算当天也登录过;

 

 用户日活表:dws.app_trf_agr_user(2020-09-05)新一天


需求:

求出用户留存分析:

留存用户定义:新用户登录后,第n日只要登录平台后,就叫n日留存。

 


 实现

步骤1:将当天的用户日活表(2020-09-05)和上一天的用户登录日期区间(2020-09-04)表合并得到当天的用户登录日期区间表(2020-09-05)

合并时考虑以下情况:
情况1:昨日不在,今不在(保留原纪录)
情况2:昨日在,今不在(修改此人的最后区间为昨日日期)
情况3:昨日在,今在(保留原纪录)
情况4:新用户(添加记录)
情况5:昨日不在,今在,(老记录要保留,新添一行,需要单独join)

SQL:
1. 用区间记录表的T-1日  FULL JOIN 日活T日
得到结果part1:情况1-4

SELECTnvl(a.guid,b.guid) as guid,nvl(a.first_dt,b.dt) as first_dt,nvl(a.rng_start,b.dt) as rng_start,casewhen a.rng_end = '9999-12-31' and b.guid is null then a.dtwhen a.rng_end is null then '9999-12-31'else a.rng_endend as rng_end
FROM dws.app_user_act_rng aFULL JOINdws.app_trf_agr_user bON a.dt='2020-09-04' AND b.dt='2020-09-05' AND a.guid = b.guid

2. 从区间记录表的T-1日中过滤出所有昨天没活跃的人, JOIN T日的日
得到结果part2:情况5

SELECTa.guid as guid,a.first_dt as first_dt,b.dt as rng_start,'9999-12-31' as rng_end
FROM(SELECTguid,first_dtFROM dws.app_user_act_rng WHERE dt='2020-09-04'GROUP BY guid,first_dtHAVING max(rng_end)!='9999-12-31') aJOINdws.app_trf_agr_user bON a.guid=b.guid and b.dt='2020-09-05'

3,part1 UNION ALL part2得到最终结果,并插入到用户登录日期区间表的新分区(2020-09-05)

 

步骤2:求出每个首登日期到几天的第n天,和第n天留存率

SELECTfirst_dt as new_dt,datediff('2020-09-05',first_dt) as ret_days, --第n日count(if(rng_end='9999-12-31',1,null)) as ret_amt --第n日留存人数
FROM dws.app_user_act_rng
WHERE dt&#61;&#39;2020-09-05&#39; AND datediff(&#39;2020-09-05&#39;,first_dt)<&#61;30
GROUP BY first_dt;

每次算出计算当天和首登日期的差值&#xff08;n&#xff09;&#xff0c;和相比于首登的n日留存人数

 


推荐阅读
  • MySQL索引详解与优化
    本文深入探讨了MySQL中的索引机制,包括索引的基本概念、优势与劣势、分类及其实现原理,并详细介绍了索引的使用场景和优化技巧。通过具体示例,帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]
  • 本文详细探讨了JDBC(Java数据库连接)的内部机制,重点分析其作为服务提供者接口(SPI)框架的应用。通过类图和代码示例,展示了JDBC如何注册驱动程序、建立数据库连接以及执行SQL查询的过程。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 本文深入探讨了 Java 中的 Serializable 接口,解释了其实现机制、用途及注意事项,帮助开发者更好地理解和使用序列化功能。 ... [详细]
  • 本文详细介绍了Akka中的BackoffSupervisor机制,探讨其在处理持久化失败和Actor重启时的应用。通过具体示例,展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]
  • 扫描线三巨头 hdu1928hdu 1255  hdu 1542 [POJ 1151]
    学习链接:http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想,后期可以求解很 ... [详细]
  • 本文讨论了如何根据特定条件动态显示或隐藏文件上传控件中的默认文本(如“未选择文件”)。通过结合CSS和JavaScript,可以实现更灵活的用户界面。 ... [详细]
  • Ralph的Kubernetes进阶之旅:集群架构与对象解析
    本文深入探讨了Kubernetes集群的架构和核心对象,详细介绍了Pod、Service、Volume等基本组件,以及更高层次的抽象如Deployment、StatefulSet等,帮助读者全面理解Kubernetes的工作原理。 ... [详细]
  • 解决Element UI中Select组件创建条目为空时报错的问题
    本文介绍如何在Element UI的Select组件中使用allow-create属性创建新条目,并处理创建条目为空时出现的错误。我们将详细说明filterable属性的必要性,以及default-first-option属性的作用。 ... [详细]
  • 本文由瀚高PG实验室撰写,详细介绍了如何在PostgreSQL中创建、管理和删除模式。文章涵盖了创建模式的基本命令、public模式的特性、权限设置以及通过角色对象简化操作的方法。 ... [详细]
  • moment 国际化设置中文语言 (全局) 及使用示例 ... [详细]
  • 本文介绍如何使用JPA Criteria API创建带有多个可选参数的动态查询方法。当某些参数为空时,这些参数不会影响最终查询结果。 ... [详细]
  • 本文详细介绍了 MySQL 中 LAST_INSERT_ID() 函数的使用方法及其工作原理,包括如何获取最后一个插入记录的自增 ID、多行插入时的行为以及在不同客户端环境下的表现。 ... [详细]
author-avatar
独孤依人x_762
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有