热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

如何分析交易记录?

【题目】某商场为了分析用户购买渠道。表1是用户交易记录表,记录了用户id、交易日期、交易类型和交易金额。表2是用户类型表,记录了用户支付类型࿰

【题目】

某商场为了分析用户购买渠道。表1是用户交易记录表,记录了用户id、交易日期、交易类型和交易金额。

表2是用户类型表,记录了用户支付类型(微信、支付宝、信用卡等),分别有type1、type2。

要求:

1.请在 type1的用户类型中,找出总交易金额最大的用户。

2.筛选每个用户的第2笔交易记录。

3.如下表:如何实现表3的数据格式?

4.两表做关联时,其中一张表的关联键有大量的null值会造成什么影响?如何规避?

【解题思路】

1.type1的用户类型中,找出单用户的总交易金额最大的一位用户?

我们先来把这个业务需求翻译成大白话:

1)表中的字段要有用户类型、交易金额、用户id

2)“单用户的总交易金额”是指每种类型用户的总交易金额

3)找出用户类型=type1,总交易金额最大的用户

1)表中的字段要有用户类型、交易金额、用户id

交易金额、用户id在用户交易记录表中,用户类型在用户类型表中,涉及到两个表的字段,所以需要进行多表联结。

观察两个表,得知两表的相同字段为用户id ,所以通过用户id联结两张表。

使用哪种联结呢?拿出《猴子 从零学会SQL》里面的多表联结图。

因为后面要分析“每种类型用户的总交易金额”,所以保留左表(用户交易记录表)中的全部用户数据。

select 用户交易记录表.* ,用户类型表.用户类型
from 用户交易记录表
left join 用户类型表
on 用户交易记录表.用户id=用户类型表.用户id;

查询结果:

2)每种类型用户的总交易金额

当有“每个”出现的时候,要想到《猴子 从零学会SQL》中讲过的用分组汇总来实现该业务问题。

根据各用户类型、用户id分组 (group by),统计每个用户数总费用(求和函数sum)

select 用户交易记录表.*,用户类型表.用户类型,sum(用户交易记录表.交易金额) as 总金额
from 用户交易记录表
left join 用户类型表
on 用户交易记录表.用户id=用户类型表.用户id
group by 用户类型表.用户类型,用户交易记录表.用户id;

查询结果:

3)找出用户类型=type1,总交易金额最大的用户

用where 筛选用户类型=type1的用户,按照总金额降序排序(order by decs),找出的第一行(limit 1)记录即为交易金额最大的用户。

select 用户类型表.用户类型,  用户交易记录表.用户id,sum(用户交易记录表.交易金额) as 总金额
from 用户交易记录表
left join 用户类型表
on 用户交易记录表.用户id = 用户类型表.用户id
where 用户类型表.用户类型 = 'type1'
group by 用户类型表.用户类型, 用户交易记录表.用户id
order by 总金额 desc limit 1;

查询结果:

2.筛选每个用户的第2笔交易记录?

1)题目要求查询“每个用户”,当每个出现的时候,就要想到分组汇总(group by或者窗口函数的partiotion  by)。

2)第2笔交易记录,是指按照交易时间对每个用户的交易记录进行排名,然后取出排名第2的数据。

又涉及到分组,又涉及到排名的问题,要想到用《猴子 从零学会SQL》里讲过的窗口函数来实现。

所以使用分组(窗口函数partiotion by 用户id),并按最后交易时间升序排列(order by交易时间 asc),套入窗口函数的语法,得出下面的sql语句:

select 用户交易记录表.*,row_number() over(partition by 用户交易记录表.用户id order by 用户交易记录表.交易日期 asc) as 交易笔数
from 用户交易记录表;


查询结果:

2)用where 筛选出每个用户的第2条记录,就是每个用户的第2笔交易记录

 

select * from
(select 用户交易记录表.*,
row_number() over(partition by 用户交易记录表.用户id order by 用户交易记录表.交易日期 asc ) as 交易笔数
from 用户交易记录表) as a
where 交易笔数=2;

查询结果:

3.如下表:如何实现表3的数据格式?

题目要求将同一用户、不用的交易时间和交易类型多行合并为一行,用group_concat函数可解决。

sql入下:

select 用户id,
group_concat(交易日期), group_concat(交易类型)
from 用户交易记录表
group by 用户id;

4.两表做关联时,其中一张表的关联键有大量的null值会造成什么影响?如何规避?

因为在关联表中的全部数据不一定在另一张表都匹配,这样没有匹配到的话就会出现null,避免出现表连接出现null值,只要在表关联时加一个where条件进行判断(not null ),具体见下图

【本题考点】

1.如何将复杂的业务问题,使用多维度拆解分析方法,翻译成大白话的能力。

2.遇到排名问题,要想到使用窗口函数来实现。

3.多表联结各个情况如何去实现?把上图看懂就可以解决99%的多表联结问题了。

推荐:如何从零学会sql?


推荐阅读
  • 本文介绍了在MySQL8.0中如何查看性能并解析SQL执行顺序。首先介绍了查询性能工具的开启方法,然后详细解析了SQL执行顺序中的每个步骤,包括from、on、join、where、group by、having、select distinct、union、order by和limit。同时还介绍了虚拟表的概念和生成过程。通过本文的解析,读者可以更好地理解MySQL8.0中的性能查看和SQL执行顺序。 ... [详细]
  • 本文介绍了如何在MySQL中将零值替换为先前的非零值的方法,包括使用内联查询和更新查询。同时还提供了选择正确值的方法。 ... [详细]
  • Oracle分析函数first_value()和last_value()的用法及原理
    本文介绍了Oracle分析函数first_value()和last_value()的用法和原理,以及在查询销售记录日期和部门中的应用。通过示例和解释,详细说明了first_value()和last_value()的功能和不同之处。同时,对于last_value()的结果出现不一样的情况进行了解释,并提供了理解last_value()默认统计范围的方法。该文对于使用Oracle分析函数的开发人员和数据库管理员具有参考价值。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 本文详细介绍了Spring的JdbcTemplate的使用方法,包括执行存储过程、存储函数的call()方法,执行任何SQL语句的execute()方法,单个更新和批量更新的update()和batchUpdate()方法,以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • 本文详细介绍了如何使用MySQL来显示SQL语句的执行时间,并通过MySQL Query Profiler获取CPU和内存使用量以及系统锁和表锁的时间。同时介绍了效能分析的三种方法:瓶颈分析、工作负载分析和基于比率的分析。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 高质量SQL书写的30条建议
    本文提供了30条关于优化SQL的建议,包括避免使用select *,使用具体字段,以及使用limit 1等。这些建议是基于实际开发经验总结出来的,旨在帮助读者优化SQL查询。 ... [详细]
  • 本文讨论了在数据库打开和关闭状态下,重新命名或移动数据文件和日志文件的情况。针对性能和维护原因,需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况,以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]
  • ubuntu用sqoop将数据从hive导入mysql时,命令: ... [详细]
  • Oracle seg,V$TEMPSEG_USAGE与Oracle排序的关系及使用方法
    本文介绍了Oracle seg,V$TEMPSEG_USAGE与Oracle排序之间的关系,V$TEMPSEG_USAGE是V_$SORT_USAGE的同义词,通过查询dba_objects和dba_synonyms视图可以了解到它们的详细信息。同时,还探讨了V$TEMPSEG_USAGE的使用方法。 ... [详细]
  • 本文讨论了如何使用IF函数从基于有限输入列表的有限输出列表中获取输出,并提出了是否有更快/更有效的执行代码的方法。作者希望了解是否有办法缩短代码,并从自我开发的角度来看是否有更好的方法。提供的代码可以按原样工作,但作者想知道是否有更好的方法来执行这样的任务。 ... [详细]
  • 模板引擎StringTemplate的使用方法和特点
    本文介绍了模板引擎StringTemplate的使用方法和特点,包括强制Model和View的分离、Lazy-Evaluation、Recursive enable等。同时,还介绍了StringTemplate语法中的属性和普通字符的使用方法,并提供了向模板填充属性的示例代码。 ... [详细]
author-avatar
让自己更加成熟一点
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有