热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据库技术:巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

问题提出先造一些测试数据以说明题目:declare@testdatatable(idint,col1varchar(20),c

问题提出

先造一些测试数据以说明题目:

  declare @testdata table(id int,col1 varchar(20),col2 varchar(20))   insert into @testdata(id,col1,col2)   select 1,'new','approved' union all   select 2,'approved','commited' union all   select 3,'commited','in progress' union all   select 4,'new','approved' union all   select 5,'new','approved' union all   select 6,'new','approved' union all   select 7,'approved','removed'   select * from @testdata    

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

数据说明,id列连续自增,列1和列2都是tfs中pbi的状态记录,就是从什么变更到什么,如新建到批准,批准到提交神马的

现在要求连续且相同的状态变更记录合并,不连续或者不同的状态变更保留,例如:

以上图为例,id为1,4,5,6的记录都是从new到approved状态,但是记录1与记录4、5、6不相邻,或者说不连续,那么就要分成两组,

记录1一组,记录4、5、6一组,其它记录因为状态变更不相同所以全部保留,最后的查询结果应该长成下图这个样子:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

继续之前你可以先自己试下,这可能会带来新的解题思路,

解题思路

该问题的关键在于group by会把记录1、4、5、6合并在一起,而这不符合要求,仅需要合并4、5、6,源表里没有这样一个字段可以将记录1与记录4、5、6区分开来,这是解题的关键

这里可以利用rank函数配合使用partition关键字,首先把1456分到一组去,同时产生一个组内排名的新字段r,这个排名r很关键,后边会用到,见下图:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

rank函数不了解的点这里

rank函数以col1 + col2为分组条件,这样分成了四组,分别是new-approved、approved-commited、commited-in progress、approved-removed

在new-approved组内,记录1、4、5、6分别排名1、2、3、4;其它组内仅一条记录,在其组内排名均为1

现在制造了一个r字段,r字段标识了每条记录在其组内的排名,排名自1开始递增,

源表内id自增,组内排名r递增,这就是解题的关键,

当连续相同的记录出现时,其id与其排名r在同时递增,则其差值是相同的,拿到这个差值就可以很容易解决题目了,看下图:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

记录4、5、6相同且连续出现,其id与其排名在同时增长,其差值则保持不变,这里使用col1 + col2 + gap作为分组条件即可将记录4、5、6合并,再取个最小id出来,问题解决,完整脚本如下:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

可是如果id不连续时怎么办呢?这个不难,参考[mssql]row_number函数

需要了解更多数据库技术:巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行,都可以关注数据库技术分享栏目—编程笔记


推荐阅读
  • 本文介绍 SQL Server 的基本概念和操作,涵盖系统数据库、常用数据类型、表的创建及增删改查等基础操作。通过实例帮助读者快速上手 SQL Server 数据库管理。 ... [详细]
  • 本文探讨了使用C#在SQL Server和Access数据库中批量插入多条数据的性能差异。通过具体代码示例,详细分析了两种数据库的执行效率,并提供了优化建议。 ... [详细]
  • This pull request introduces the ability to provide comprehensive paragraph configurations directly within the Create Note and Create Paragraph REST endpoints, reducing the need for additional configuration calls. ... [详细]
  • 本文详细介绍了 iBatis.NET 中的 Iterate 元素,它用于遍历集合并重复生成每个项目的主体内容。通过该元素,可以实现类似于 foreach 的功能,尽管 iBatis.NET 并未直接提供 foreach 标签。 ... [详细]
  • 本文介绍如何在SQL Server中创建动态SQL存储过程,并提供详细的代码实例和解释。通过这种方式,可以更灵活地处理查询条件和参数。 ... [详细]
  • 本文介绍了一个SQL Server自定义函数,用于从字符串中提取仅包含数字和小数点的子串。该函数通过循环删除非数字字符来实现,并附带创建测试表、存储过程以演示其应用。 ... [详细]
  • 目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]
  • PHP 过滤器详解
    本文深入探讨了 PHP 中的过滤器机制,包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时,详细介绍了各种过滤器的用途和用法。 ... [详细]
  • 本文介绍了一种在 MySQL 客户端执行 NOW() 函数时出现时间偏差的问题,并详细描述了如何通过配置文件调整时区设置来解决该问题。演示场景中,假设当前北京时间为2023年2月17日19:31:37,而查询结果显示的时间比实际时间晚8小时。 ... [详细]
  • 算法题解析:最短无序连续子数组
    本题探讨如何通过单调栈的方法,找到一个数组中最短的需要排序的连续子数组。通过正向和反向遍历,分别使用单调递增栈和单调递减栈来确定边界索引,从而定位出最小的无序子数组。 ... [详细]
  • 深入解析Redis内存对象模型
    本文详细介绍了Redis内存对象模型的关键知识点,包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析,帮助读者全面理解Redis内存管理机制。 ... [详细]
  • 本文详细介绍了如何通过RPM包在Linux系统(如CentOS)上安装MySQL 5.6。涵盖了检查现有安装、下载和安装RPM包、配置MySQL以及设置远程访问和开机自启动等步骤。 ... [详细]
  • 方法:1 配置数据库basediros.path.abspath(os.path.dirname(__file__))  #获取当前文件的绝对路径appFlask(__name__ ... [详细]
  • 本文作者分享了在阿里巴巴获得实习offer的经历,包括五轮面试的详细内容和经验总结。其中四轮为技术面试,一轮为HR面试,涵盖了大量的Java技术和项目实践经验。 ... [详细]
  • 本文介绍了如何利用 Spring Boot 和 Groovy 构建一个灵活且可扩展的动态计算引擎,以满足钱包应用中类似余额宝功能的推广需求。我们将探讨不同的设计方案,并最终选择最适合的技术栈来实现这一目标。 ... [详细]
author-avatar
吴家南小南
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有