当前位置: 开发笔记 > 数据库 > 正文

SQL进行排序、分组、统计的10个新技巧分享

作者：龙行天下1027 | 来源：互联网 | 2021-09-06 07:15

这篇文章介绍了SQL进行排序、分组、统计的10个新技巧，有需要的朋友可以参考一下

1.使用排序使数据有序
通常，你的所有数据真正需要的仅仅是按某种顺序排列。SQL的ORDER BY语句可以以字母或数字顺序组织数据。因此，相似的值按组排序在一起。然而，这个分组时排序的结果，并不是真的分组。ORDER BY显示每条记录而分组可能代表很多记录。
2.进行分组除去重复值

排序和分组之间的最大区别是：排序的数据显示所有记录（在限定标准范围之内），而分组数据不是显示所有记录。GROUP BY语句对于同样的值只显示一条记录。例如，下面的语句中的GROUP BY语句对数据源中重复出现的数据只返回唯一的zip编码列。

代码如下:

SELECT ZIP FROM Customers GROUP BY ZIP

只包括由GROUP BY和SELECT语句共同定义的那些记录，换句话说，SELECT列表必须满足GROUP BY列表，但是有一个例外就是SELECT列表可以包含聚合函数（GROUP BY语句不允许使用聚合函数）。需要注意的是GROUP BY语句不会对结果分组进行排序。为了使分组按字母或数字有序排列，需要添加ORDER BY语句。此外，在GROUP BY语句中不能引用使用了别名的字段。分组栏目必须是潜在的数据，但它们并不需要显示在结果中。
3.在分组之前进行数据筛选

你可以添加一个WHERE语句来筛选有GROUP BY所得分组中的数据。例如，下面的语句只返回肯塔基州顾客的唯一ZIP编码列。

代码如下:

SELECT ZIP FROM Customers WHERE State = 'KY' GROUP BY ZIP

必须注意的是WHERE语句是在GROUP BY语句求值之前进行数据过滤的。与GROUP BY语句一样，WHERE语句也不支持聚合函数。
4.返回所有分组

当你使用WHERE语句过滤数据时，结果分组中只显示你指定的那些记录，而符合分组定义但是不满足过滤条件的数据不会包含在某个分组中。当你想在分组中包含所有数据时添加关键字ALL即可，这时WHERE条件就不起作用。例如，在前面的例子中添加关键字ALL就会返回所有的ZIP分组，而不是仅在肯塔基州的那些。

代码如下:

SELECT ZIP FROM Customers WHERE State = 'KY' GROUP BY ALL ZIP

这样看来，这两个语句存在冲突，你可能不会以这种方式使用关键字ALL。当你使用聚合函数计算某一列时，使用ALL关键字可能会很方便。例如，下面的语句计算每个肯塔基州ZIP中的顾客数，同时，还会显示其它的ZIP值。

代码如下:

  
SELECT ZIP, Count(ZIP) AS KYCustomersByZIP FROM Customers WHERE State = 'KY' GROUP BY ALL ZIP  
 

结果分组包括潜在数据中的所有ZIP值，然而，对于那些不是肯塔基州ZIP分组的聚合列(KYCustomersByZIP)将会显示0。远程查询不支持GROUP BY ALL。
5.分组后筛选数据
WHERE语句在GROUP BY语句之前进行计算。当你需要在分组之后筛选数据时，可以使用HAVING语句。通常情况下，WHERE语句和HAVING语句的返回结果是一样的，但是值得注意的是这两个语句不可互换。当你迷惑时，可以遵循下面的说明：使用WHERE语句过滤记录，使用HAVING语句过滤分组。

一般情况，你会使用HAVING语句和某个聚合函数计算一个分组。例如，下面的语句返回一个唯一的ZIP编码列，但是可能不会包含潜在数据源中所有的ZIP。

代码如下:

 
SELECT ZIP, Count(ZIP) AS Customers FROM Customers GROUP BY ZIP HAVING Count(ZIP) = 1  
 

只有那些包含一位顾客的分组显示在结果中。
6.进一步了解WHERE和HAVING语句
如果你对何时应该使用WHERE，何时使用HAVING仍旧很迷惑，请遵照下面的说明：
WHERE语句在GROUP BY语句之前；SQL会在分组之前计算WHERE语句。
HAVING语句在GROUP BY语句之后；SQL会在分组之后计算HAVING语句。
7.使用聚合函数统计分组数据

分组数据可以帮助我们分析数据，但是有时我们可能需要更多的信息而不仅仅是分组。你可以使用聚合函数来统计分组数据。例如，下面的语句显示每批订购单的总价钱。

代码如下:

SELECT OrderID, Sum(Cost * Quantity) AS OrderTotal  FROM Orders GROUP BY OrderID  
 

对于其它的分组来说，SELECT和GROUP　ＢＹ列必须匹配。而SELECT语句包含聚合函数时这一规则是一个例外.
8.统计聚合数据

你可以继续统计数据为每个分组显示一个分类统计。SQL的ROLLUP操作符可以为每个分组显示一个额外的分类统计。这个分类统计是使用聚合函数计算每个分组中的所有记录得到的结果。下面的语句为每个分组计算OrderTotal：

代码如下:

 
SELECT Customer, OrderNumber, Sum(Cost * Quantity)  AS OrderTotal FROM Orders GROUP BY Customer, OrderNumber WITH ROLLUP  

对于有两个分别为20和25 OderTotal值的分组，ROLLUP显示一个OrderTotal值45。ROLLUP结果中的第一条记录是唯一的，因为它是计算所有分组记录，这个值是整个记录集的总值。
ROLLUP在聚合函数中不支持 DISTINCT，也不支持GROUP BY ALL语句。
9.统计每个列

CUBE操作符比ROLLUP更进一步，它返回每个分组中重复值的个数。它的结果和ROLLUP相同，但是对每位客户的每一列CUBE包含一个额外的记录。下面的语句显示每个分组的统计和额外每位客户的统计。

代码如下:

 
SELECT Customer, OrderNumber, Sum(Cost * Quantity)  AS OrderTotal FROM Orders GROUP BY Customer, OrderNumber WITH CUBE  
 

CUBE可以给最综合的统计。它不仅完成聚合和ROLLUP的功能，还可以计算定义分组的其它列，换句话说，CUBE统计每个可能的列组合。
CUBE不支持GROUP BY ALL语句。
10：对统计结果排序

当CUBE的结果令人迷惑时（它经常是这样），可以添加一个GROUPING函数，如下所示：

代码如下:

  
SELECT GROUPING(Customer), OrderNumber, Sum(Cost * Quantity) AS OrderTotal FROM Orders GROUP BY Customer, OrderNumber WITH CUBE  
 

结果中每行包含两个额外的值：
值1表示左边的值是一个统计值，是ROLLUP或CUBE的操作符。

值0表示左边的值是一条由最初的GROUP BY语句产生的详细记录。

推荐阅读

数据库
使用 SQLiteJDBC 和 HikariCP 实现 Java 程序连接 SQLite 数据库

本文介绍了如何通过 Maven 依赖引入 SQLiteJDBC 和 HikariCP 包，从而在 Java 应用中高效地连接和操作 SQLite 数据库。文章提供了详细的代码示例，并解释了每个步骤的实现细节。 ... [详细]

蜡笔小新 2024-12-26 17:34:42
sql
解决SQL Server动态SQL中LIKE语句参数传递导致无返回值的问题

在使用SQL Server进行动态SQL查询时，如果遇到LIKE语句无法正确返回预期结果的情况，通常是因为参数传递方式不当。本文将详细探讨这一问题，并提供解决方案及相关的技术背景。 ... [详细]

蜡笔小新 2024-12-26 17:02:33
数据库
PostgreSQL中的模式管理

本文由瀚高PG实验室撰写，详细介绍了如何在PostgreSQL中创建、管理和删除模式。文章涵盖了创建模式的基本命令、public模式的特性、权限设置以及通过角色对象简化操作的方法。 ... [详细]

蜡笔小新 2024-12-26 11:37:26
数据库
Python 爬虫基础教程及代码实例

根据最新发布的《互联网人才趋势报告》，尽管大量IT从业者已转向Python开发，但随着人工智能和大数据领域的迅猛发展，仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-26 10:42:40
数据库
openGauss每日一练：第6天 - 模式的创建、修改与删除

本篇笔记记录了openGauss数据库中关于模式（Schema）的创建、修改和删除操作。通过这些操作，用户可以更好地管理和控制数据库对象。实验环境为openGauss 2.0.0，并使用由墨天轮提供的线上环境。 ... [详细]

蜡笔小新 2024-12-26 00:17:35
sql
MySQL LAST_INSERT_ID() 函数深入解析

本文详细介绍了 MySQL 中 LAST_INSERT_ID() 函数的使用方法及其工作原理，包括如何获取最后一个插入记录的自增 ID、多行插入时的行为以及在不同客户端环境下的表现。 ... [详细]

蜡笔小新 2024-12-25 22:04:04
数据库
深入解析三大范式与JDBC集成

本文详细探讨了数据库设计中的三大范式，并结合Java数据库连接（JDBC）技术，讲解如何在实际开发中应用这些概念。通过实例和图表，帮助读者更好地理解范式理论及其在数据操作中的重要性。 ... [详细]

蜡笔小新 2024-12-25 20:12:13
数据库
深入解析JDBC源码

本文详细探讨了JDBC（Java数据库连接）的内部机制，重点分析其作为服务提供者接口（SPI）框架的应用。通过类图和代码示例，展示了JDBC如何注册驱动程序、建立数据库连接以及执行SQL查询的过程。 ... [详细]

蜡笔小新 2024-12-25 19:59:15
oracle
MySQL索引详解与优化

本文深入探讨了MySQL中的索引机制，包括索引的基本概念、优势与劣势、分类及其实现原理，并详细介绍了索引的使用场景和优化技巧。通过具体示例，帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]

蜡笔小新 2024-12-25 19:52:47
数据库
深入理解领域驱动设计及其实践

本文探讨了领域驱动设计（DDD）的核心概念、应用场景及其实现方式，详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型，展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]

蜡笔小新 2024-12-25 18:45:55
oracle
对MariaDB未来发展的思考与担忧

本文探讨了MariaDB在当前数据库市场中的地位和挑战，分析其可能面临的困境，并提出了对未来发展的几点看法。 ... [详细]

蜡笔小新 2024-12-25 18:20:32
oracle
Oracle SQL 动态执行与事务管理：动态SQL是否支持回滚？

本文探讨了在Oracle数据库中，动态SQL语句的执行及其对事务管理的影响，特别是关于回滚操作的有效性。重点讨论了一个具体场景：将预警短信从当前表迁移到历史表时遇到的字段长度不匹配问题及相应的异常处理。 ... [详细]

蜡笔小新 2024-12-25 16:52:29
oracle
掌握Java EE的全面指南

探讨如何真正掌握Java EE，包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法，并提供了详尽的标准。 ... [详细]

蜡笔小新 2024-12-25 13:38:29
redis
Python入门指南：从零开始的全面学习路线

本文详细介绍了Python编程语言的学习路径，涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划，帮助初学者快速掌握Python的核心技能。 ... [详细]

蜡笔小新 2024-12-25 12:54:33
数据库
C++面试高频题

作者：守望者1028链接：https:www.nowcoder.comdiscuss55353来源：牛客网面试高频题：校招过程中参考过牛客诸位大佬的面经，但是具体哪一块是参考谁的我 ... [详细]

蜡笔小新 2024-12-25 12:32:36

龙行天下1027

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章