当前位置: 开发笔记 > 数据库 > 正文

SQL如何查找数据库多栏位重复数据？-php教程

作者：天地菲人间_984 | 来源：互联网 | 2017-05-14 02:20

首先，我有一个电影数据库，这是其中的一部分：[rel]movie_id,star_id,time一般是一个电影，对应多个演出明星。本来相同的movie_id和star_id在数据库中只能出现一次。可是之前系统设计漏洞，导致重复插入...

首先，我有一个电影数据库，这是其中的一部分：
[rel] movie_id, star_id, time

一般是一个电影，对应多个演出明星。本来相同的movie_id 和 star_id 在数据库中只能出现一次。
可是之前系统设计漏洞，导致重复插入了多项数据：
譬如：
功夫，周星驰
功夫，黄圣依
功夫，周星驰
等于是我们数据库中出现了两个功夫, 周星驰。

请问各位朋友，有没有可以设计一个sql语句，帮我快速的查找出这些冗余的项和电影的id。

回复内容：

首先，我有一个电影数据库，这是其中的一部分：
[rel] movie_id, star_id, time

请问各位朋友，有没有可以设计一个sql语句，帮我快速的查找出这些冗余的项和电影的id。

保留id最小的记录

查询重复数据
select * from TABLE_NAME where (movie_id,star_id) in (select movie_id,star_id from TABLE_NAME group by movie_id,star_id having count() > 1) and id not in (select min(id) from TABLE_NAME group by movie_id,star_id having count()>1)

删除重复数据
delete from TABLE_NAME where (movie_id,star_id) in (select movie_id,star_id from TABLE_NAME group by movie_id,star_id having count() > 1) and id not in (select min(id) from TABLE_NAME group by movie_id,star_id having count()>1)

sqlSELECT movie_id, star_id, COUNT(*) FROM xxx GROUP BY (movie_id + '-' + star_id) HAVING COUNT(*) > 1

我是有一个和你差不多的，但是我高并发，一分钟3000条数据入库。
我是先将数据放memcahe里面，
每个入库的先匹配，
如果没有，就入库，
如果有的，比较数据时间戳，再做处理。。。。

SELECT distinct movie_id, star_id FROM xxx

SELECT t.id, t.movie_id, t.star_id from xxx AS t LEFT JOIN xxx AS t1 on t.movie_id = t1.movie_id WHERE t.id != t1.id AND t.star_id = t1.star_id

把xxx换成你的表名，这里的id是主键id，如果你表里没有那就换成time，但是这样可能会造成time也相同的重复数据无法被找到。

推荐阅读

nosql
厘清机器学习与数据分析的界限

本文旨在探讨机器学习与数据分析之间的差异，不仅在于它们处理的数据类型，还包括技术背景、业务应用场景以及参与者的不同。通过深入分析，希望能为读者提供清晰的理解。 ... [详细]

蜡笔小新 2024-12-12 15:15:36
mysql
导入大csv文件到mysql（CSV导入）

导入大csv文件到mysql（CSV导入） ... [详细]

蜡笔小新 2024-12-12 15:01:40
mysql
如何在Python中创建或重定义SQLite函数

本文探讨了在Python中利用sqlite3库创建或重定义SQLite函数的方法，包括自定义函数和修改现有函数的行为。 ... [详细]

蜡笔小新 2024-12-12 03:52:43
hbase
58同城的Elasticsearch应用与平台构建实践

本文由58同城高级架构师于伯伟分享，由陈树昌编辑整理，内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用，特别是在58同城的实施案例，包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]

蜡笔小新 2024-12-11 19:31:21
oracle
.NET Core中的一个接口多种实现的依赖注入与动态选择看这篇就够了

.NETCore中的一个接口多种实现的依赖注入与动态选择看这篇就够了最近有个需求就是一个抽象仓储层接口方法需要SqlServer以及Oracle两种实现方式，为了灵活我在依赖注入的 ... [详细]

蜡笔小新 2024-12-11 18:50:27
sql
如何使用SQL查询过去7天的数据

请求一段SQL代码，用于从数据库中提取当前日期前7天的数据记录。例如，如果今天是2011年5月9日，则需要获取从2011年5月3日至2011年5月9日之间的所有记录。 ... [详细]

蜡笔小新 2024-12-11 17:26:34
sql
SQL Server 实例默认排序规则详解

本文详细介绍了如何在安装过程中为 SQL Server 实例指定默认排序规则，并讨论了不同安装选项下的排序规则选择逻辑。 ... [详细]

蜡笔小新 2024-12-11 17:06:51
mysql
使用Solr从MySQL导入数据构建全量索引

为了更好地掌握Solr的各项功能，本文档将在本地Windows环境中演示如何从MySQL数据库中导入数据至Solr，并构建全量索引。这将有助于开发者熟悉Solr的数据处理流程，尤其是在无法直接在生产服务器上进行实践的情况下。 ... [详细]

蜡笔小新 2024-12-11 16:27:23
mysql
MySQL中的Anemometer使用指南

本文详细介绍了如何在MySQL环境中部署和使用Anemometer，以帮助开发者有效监控和优化慢查询性能。通过本文，您将了解从环境准备到具体配置的全过程。 ... [详细]

蜡笔小新 2024-12-11 16:16:39
sql
SPSS应用指南：t检验与卡方检验的简易解析

本文旨在为读者提供SPSS中t检验和卡方检验的简单明了介绍，帮助初学者快速掌握这两种常用统计方法的应用技巧。通过实际案例分析，加深对理论知识的理解。 ... [详细]

蜡笔小新 2024-12-11 15:46:42
oracle
Oracle数据库中的角色管理与测试

本文探讨了Oracle数据库中角色的创建与管理方法，包括如何使用SET ROLE命令激活特定角色，并调整用户的默认角色设置。 ... [详细]

蜡笔小新 2024-12-11 14:17:11
sql
如何在HTML中为两个不同的div设置不同的overflow属性

探讨在Web前端开发中，如何使用CSS的overflow属性来实现两个div的不同滚动效果，特别是当设计一个弹出窗口时的需求处理。 ... [详细]

蜡笔小新 2024-12-11 14:15:36
sql
使用TSimpleMsgPack进行消息打包与解包的示例

本文介绍了如何在Delphi中使用TSimpleMsgPack组件来实现消息的打包和解包功能，包括网络通信中的数据处理。 ... [详细]

蜡笔小新 2024-12-11 13:17:44
oracle
Java项目连接Oracle数据库时遇到异常

在尝试通过Java项目连接Oracle数据库时，遇到了一个严重的初始化上下文监听器异常。 ... [详细]

蜡笔小新 2024-12-11 12:55:52
mysql
Python 3.3 与 MySQL 数据库交互指南

本文详细介绍了如何在 Python 3.3 环境下操作 MySQL 数据库，包括调用存储过程、连接数据库以及基本的数据操作方法。 ... [详细]

蜡笔小新 2024-12-11 12:41:21

天地菲人间_984

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章