Oracle查询与删除表中的重复记录sql语句

作者：每天洗脸的小媳妇_853 | 来源：互联网 | 2017-05-12 14:55

不管我使用什么数据库都碰到有重复数据的存在了，下面我来给大这详细介绍Oracle删除表中的重复记录的各种方法与性能分析，有需要了解的朋友可参考。

不管我使用什么数据库都碰到有重复数据的存在了，下面我来给大这详细介绍Oracle 删除表中的重复记录的各种方法与性能分析，有需要了解的朋友可参考。

方法：

代码如下
XX having count(*)>1,rowid,distinct,temporary table,procedure

下面语句可以查询出那些数据是重复的：

代码如下
字段1,字段2,count() from 表名 group by 字段1,字段2 having count() > 1

将上面的>号改为=号就可以查询出没有重复的数据了。
想要删除这些重复的数据，可以使用下面语句进行删除

代码如下
delete from 表名 a where 字段1,字段2 in 　　(select 字段1,字段2,count() from 表名 group by 字段1,字段2 having count() > 1)

例

1、查询表中的重复数据

a.重复一个字段

b.重复多个字段

c.重复一整行

创建测试表：

代码如下

create table cfa (businessid number,customer varchar2(50),branchcode varchar2(10),data_date varchar2(10));
insert into cfa values (1,'Albert','SCB','2011-11-11');
insert into cfa values (2,'Andy','DB','2011-11-12');
insert into cfa values (3,'Allen','HSBC','2011-11-13');

---------------以下为重复数据----------------------------------------------
insert into cfa values (1,'Alex','ICBC','2011-11-14');
insert into cfa values (1,'Albert','CTBK','2011-11-15');
insert into cfa values (1,'Albert','SCB','2011-11-11');

对于a的情况,只有businessid重复

代码如下
select * from cfa where businessid in (select businessid from cfa group by businessid having count(businessid)>1);

如果是b的情况，businessid 和name同时存在重复

代码如下
select * from cfa where (businessid,customer) in (select businessid,customer from cfa group by businessid,customer having count(*)>1);

对于c的情况，重复一整行

参考b的方法：

代码如下
select * from cfa where (businessid,customer,branchcode,data_date) in (select * from cfa group by businessid,customer,branchcode,data_date having count(*)>1);

2、删除表中的重复数据

a情况，删除表中多余的重复记录，重复记录是根据单个字段（businessid）来判断，只留有rowid最小的记录

也可以只保留rowid不是最小记录，需要把代码中的min改为max这里不再赘述。

代码如下
delete from cfa where businessid in (select businessid from cfa group by businessid having count(businessid) > 1) and rowid not in (select min(rowid) from cfa group by businessid having count(businessid) > 1);

或者，使用下面更简单高效的语句

代码如下
DELETE FROM cfa t WHERE t.ROWID > (SELECT MIN(X.ROWID) FROM cfa X WHERE X.businessid = t.businessid);

b情况，删除表中多余的重复记录（多个字段），只留有rowid最小的记录

代码如下
delete from cfa where (businessid,customer) in (select businessid,customer from cfa group by businessid,customer having count() > 1) and rowid not in (select min(rowid) from cfa group by businessid,customer having count() > 1);

或者，使用下面更简单高效的语句

代码如下
DELETE FROM cfa t WHERE t.ROWID > (SELECT MIN(X.ROWID) FROM cfa X WHERE X.businessid = t.businessid and x.customer = t.customer);

上面的语句非常简单，就是将查询到的数据删除掉。不过这种删除执行的效率非常低，对于大数据量来说，可能会将吊死。所以我建议先将查询到的重复的数据插入到一个临时表中，然后对进行删除，这样，执行删除的时候就不用再进行一次查询了。如下：

CREATE TABLE 临时表 AS

代码如下
(select 字段1,字段2,count() from 表名 group by 字段1,字段2 having count() > 1)

　　上面这句话就是建立了临时表，并将查询到的数据插入其中。
　　下面就可以进行这样的删除操作了：

代码如下
delete from 表名 a where 字段1,字段2 in (select 字段1，字段2 from 临时表);

　　这种先建临时表再进行删除的操作要比直接用一条语句进行删除要高效得多。

c情况，这种情况就比较简单，使用临时表方法

代码如下

create table cfabak as select distinct * from cfa;

truncate table cfa;--如果是生产最好对该表backup

Insert into cfa select * from cfabak;

commit；

我们要删除重复数据，只保留最新的一条数据，就可以这样写了：

代码如下
delete from 表名 a 　　where a.rowid != 　　( 　　select max(b.rowid) from 表名 b 　　where a.字段1 = b.字段1 and 　　a.字段2 = b.字段2 　　)

推荐阅读

php
深入理解父组件与子组件的引用和访问

本文详细介绍了如何在Vue.js中通过$children和$refs属性实现父组件对子组件的访问，并提供了具体的代码示例及最佳实践。 ... [详细]

蜡笔小新 2024-12-28 13:15:10
数组
LeetCode 540：有序数组中的唯一元素

来源：力扣（LeetCode），链接：https://leetcode-cn.com/problems/single-element-in-a-sorted-array。题目要求在仅包含整数的有序数组中，找到唯一出现一次的元素，并确保算法的时间复杂度为 O(log n) 和空间复杂度为 O(1)。 ... [详细]

蜡笔小新 2024-12-28 13:14:07
数组
2023 ARM嵌入式系统全国技术巡讲

2023 ARM嵌入式系统全国技术巡讲旨在分享ARM公司在半导体知识产权(IP)领域的最新进展。作为全球领先的IP提供商，ARM在嵌入式处理器市场占据主导地位，其产品广泛应用于90%以上的嵌入式设备中。此次巡讲将邀请来自ARM、飞思卡尔以及华清远见教育集团的行业专家，共同探讨当前嵌入式系统的前沿技术和应用。 ... [详细]

蜡笔小新 2024-12-28 11:58:48
数组
解决 IIS 中 PHP 页面无法访问的问题

本文介绍如何解决在 IIS 环境下 PHP 页面无法找到的问题。主要步骤包括配置 Internet 信息服务管理器中的 ISAPI 扩展和 Active Server Pages 设置，确保 PHP 脚本能够正常运行。 ... [详细]

蜡笔小新 2024-12-28 11:54:54
io
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
io
周期性出现的时间戳字段异常问题

探讨一个老旧 PHP MySQL 系统中，时间戳字段不定期出现异常值的问题及其可能原因。 ... [详细]

蜡笔小新 2024-12-28 11:46:54
io
国内BI工具迎战国际巨头Tableau，稳步崛起

尽管商业智能（BI）工具在中国的普及程度尚不及国际市场，但近年来，随着本土企业的持续创新和市场推广，国内主流BI工具正逐渐崭露头角。面对国际品牌如Tableau的强大竞争，国内BI工具通过不断优化产品和技术，赢得了越来越多用户的认可。 ... [详细]

蜡笔小新 2024-12-28 11:12:44
io
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
io
郑州大学在211高校中的地位与排名解析

本文将详细解读郑州大学作为一所位于河南省的211和双一流B类高校，在全国211高校中的地位与排名，帮助高三学生更好地了解这所知名学府的实力与发展前景。 ... [详细]

蜡笔小新 2024-12-28 10:08:34
select
深入理解 Oracle 存储函数：计算员工年收入

本文介绍如何使用 Oracle 存储函数查询特定员工的年收入。我们将详细解释存储函数的创建过程，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-28 09:49:42
less
优化ASM字节码操作：简化类转换与移除冗余指令

本文探讨如何利用ASM框架进行字节码操作，以优化现有类的转换过程，简化复杂的转换逻辑，并移除不必要的加0操作。通过这些技术手段，可以显著提升代码性能和可维护性。 ... [详细]

蜡笔小新 2024-12-28 09:35:00
less
2018回顾与2019展望

本文总结了2018年的关键成就，包括职业变动、购车、考取驾照等重要事件，并分享了读书、工作、家庭和朋友方面的感悟。同时，展望2019年，制定了健康、软实力提升和技术学习的具体目标。 ... [详细]

蜡笔小新 2024-12-28 09:10:26
less
电子元件封装库：三极管、MOS管及部分LDO（含3D模型）

本资源汇集了常用的插件和贴片三极管、MOS管以及部分LDO的封装，涵盖TO和SOT系列。所有封装均配有高质量的3D模型，共计96种，满足日常设计需求。 ... [详细]

蜡笔小新 2024-12-28 09:05:19
less
四载相伴，与51CTO学院共成长

在计算机技术的学习道路上，51CTO学院以其专业性和专注度给我留下了深刻印象。从2012年接触计算机到2014年开始系统学习网络技术和安全领域，51CTO学院始终是我信赖的学习平台。 ... [详细]

蜡笔小新 2024-12-28 08:20:07
io
CSS 布局：液态三栏混合宽度布局

本文介绍了如何使用 CSS 实现液态的三栏布局，其中各栏具有不同的宽度设置。通过调整容器和内容区域的属性，可以实现灵活且响应式的网页设计。 ... [详细]

蜡笔小新 2024-12-28 02:40:28

每天洗脸的小媳妇_853

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章