热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

数据库技术:巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

问题提出先造一些测试数据以说明题目:declare@testdatatable(idint,col1varchar(20),c

问题提出

先造一些测试数据以说明题目:

  declare @testdata table(id int,col1 varchar(20),col2 varchar(20))   insert into @testdata(id,col1,col2)   select 1,'new','approved' union all   select 2,'approved','commited' union all   select 3,'commited','in progress' union all   select 4,'new','approved' union all   select 5,'new','approved' union all   select 6,'new','approved' union all   select 7,'approved','removed'   select * from @testdata    

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

数据说明,id列连续自增,列1和列2都是tfs中pbi的状态记录,就是从什么变更到什么,如新建到批准,批准到提交神马的

现在要求连续且相同的状态变更记录合并,不连续或者不同的状态变更保留,例如:

以上图为例,id为1,4,5,6的记录都是从new到approved状态,但是记录1与记录4、5、6不相邻,或者说不连续,那么就要分成两组,

记录1一组,记录4、5、6一组,其它记录因为状态变更不相同所以全部保留,最后的查询结果应该长成下图这个样子:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

继续之前你可以先自己试下,这可能会带来新的解题思路,

解题思路

该问题的关键在于group by会把记录1、4、5、6合并在一起,而这不符合要求,仅需要合并4、5、6,源表里没有这样一个字段可以将记录1与记录4、5、6区分开来,这是解题的关键

这里可以利用rank函数配合使用partition关键字,首先把1456分到一组去,同时产生一个组内排名的新字段r,这个排名r很关键,后边会用到,见下图:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

rank函数不了解的点这里

rank函数以col1 + col2为分组条件,这样分成了四组,分别是new-approved、approved-commited、commited-in progress、approved-removed

在new-approved组内,记录1、4、5、6分别排名1、2、3、4;其它组内仅一条记录,在其组内排名均为1

现在制造了一个r字段,r字段标识了每条记录在其组内的排名,排名自1开始递增,

源表内id自增,组内排名r递增,这就是解题的关键,

当连续相同的记录出现时,其id与其排名r在同时递增,则其差值是相同的,拿到这个差值就可以很容易解决题目了,看下图:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

记录4、5、6相同且连续出现,其id与其排名在同时增长,其差值则保持不变,这里使用col1 + col2 + gap作为分组条件即可将记录4、5、6合并,再取个最小id出来,问题解决,完整脚本如下:

巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行

可是如果id不连续时怎么办呢?这个不难,参考[mssql]row_number函数

需要了解更多数据库技术:巧妙利用PARTITION分组排名递增特性解决合并连续相同数据行,都可以关注数据库技术分享栏目—编程笔记


推荐阅读
  • binlog2sql,你该知道的数据恢复工具
    binlog2sql,你该知道的数据恢复工具 ... [详细]
  • 本文详细介绍如何在SSM(Spring + Spring MVC + MyBatis)框架中实现分页功能。包括分页的基本概念、数据准备、前端分页栏的设计与实现、后端分页逻辑的编写以及最终的测试步骤。 ... [详细]
  • 本文回顾了作者在求职阿里和腾讯实习生过程中,从最初的迷茫到最后成功获得Offer的心路历程。文中不仅分享了个人的面试经历,还提供了宝贵的面试准备建议和技巧。 ... [详细]
  • Python3爬虫入门:pyspider的基本使用[python爬虫入门]
    Python学习网有大量免费的Python入门教程,欢迎大家来学习。本文主要通过爬取去哪儿网的旅游攻略来给大家介绍pyspid ... [详细]
  • MVC模式下的电子取证技术初探
    本文探讨了在MVC(模型-视图-控制器)架构下进行电子取证的技术方法,通过实际案例分析,提供了详细的取证步骤和技术要点。 ... [详细]
  • 本文探讨了使用Python实现监控信息收集的方法,涵盖从基础的日志记录到复杂的系统运维解决方案,旨在帮助开发者和运维人员提升工作效率。 ... [详细]
  • 【MySQL】frm文件解析
    官网说明:http:dev.mysql.comdocinternalsenfrm-file-format.htmlfrm是MySQL表结构定义文件,通常frm文件是不会损坏的,但是如果 ... [详细]
  • 本文探讨了互联网服务提供商(ISP)如何可能篡改或插入用户请求的数据流,并提供了有效的技术手段来防止此类劫持行为,确保网络环境的安全与纯净。 ... [详细]
  • 数据输入验证与控件绑定方法
    本文提供了多种数据输入验证函数及控件绑定方法的实现代码,包括电话号码、数字、传真、邮政编码、电子邮件和网址的验证,以及报表绑定和自动编号等功能。 ... [详细]
  • 本文介绍了MySQL窗口函数的基本概念、应用场景及常见函数的使用方法。窗口函数在处理复杂查询时非常有用,例如计算每个用户的订单排名、环比增长率、以及动态聚合等。 ... [详细]
  • 1、编写一个Java程序在屏幕上输出“你好!”。programmenameHelloworld.javapublicclassHelloworld{publicst ... [详细]
  • 解决ADODB连接Access时出现80004005错误的方法
    本文详细介绍了如何解决在使用ADODB连接Access数据库时遇到的80004005错误,包括错误原因分析和具体的解决步骤。 ... [详细]
  • 基于SSM框架的在线考试系统:随机组卷功能详解
    本文深入探讨了基于SSM(Spring, Spring MVC, MyBatis)框架构建的在线考试系统中,随机组卷功能的设计与实现方法。 ... [详细]
  • 在开发过程中,有时需要提供用户创建数据库的功能。本文介绍了如何利用 .NET 和 ADOX 在应用程序中实现创建 Access 数据库,并详细说明了创建数据库及表的具体步骤。 ... [详细]
  • Hibernate全自动全映射ORM框架,旨在消除sql,是一个持久层的ORM框架1)、基础概念DAO(DataAccessorOb ... [详细]
author-avatar
吴家南小南
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有