oracle取两个值同时不为0_PostgreSQL简单验证，似是而非unionall后orderby取limit

作者：打完BOSS好睡觉1998 | 来源：互联网 | 2023-07-29 16:12

文章之前的描述存在不少问题，今天重新改写了些内容。开篇之前还是先来回顾一下这个错误的MySQL优化案例：开发同学期望将两个表的数据汇集之后，

文章之前的描述存在不少问题&＃xff0c;今天重新改写了些内容。

开篇之前还是先来回顾一下这个错误的MySQL优化案例&＃xff1a;

开发同学期望将两个表的数据汇集之后&＃xff0c;取满足条件的top N&＃xff0c;于是使用union all联合两个结果集&＃xff0c;最后使用limit取top 30。两个表的数据量接近500w&＃xff0c;执行耗时12.66秒&＃xff1a;

整体来看&＃xff0c;性能比较差&＃xff0c;下面这种优化是期望将limit推入到两个联合的子句中来减少联合对性能影响&＃xff0c;执行耗时在0.03秒&＃xff0c;效果还不错。

但这里用到的优化思路看起来好像没有问题&＃xff0c;但逻辑的实现是有问题的&＃xff0c;而且改写前原SQL的逻辑也是存在问题的&＃xff0c;具体是什么问题&＃xff0c;看完下面的实验之后&＃xff0c;相信也就自然明白了。

下面我们通过PostgreSQL来演示一下这里埋的是什么坑。MySQL和Oracle应该也是一样的效果。时间有限&＃xff0c;就不做过多对比了。

先来创建两个测试表&＃xff1a;

然后每张表简单插入3行数据即可&＃xff1a;

akendb&＃61;# select * from tab01; id | num_col01 ----&＃43;----------- 1 | 100 3 | 45 3 | 11(3 rows)akendb&＃61;# select * from tab02; id | num_col01 ----&＃43;----------- 1 | 73 2 | 58 2 | 22(3 rows)akendb&＃61;#

--两表数据union all&＃xff1a;

(select * from tab01 )

union all

(select * from tab02)

akendb&＃61;# (select * from tab01 ) akendb-# union all akendb-# (select * from tab02) ; id | num_col01 ----&＃43;----------- 1 | 100 3 | 45 3 | 11 1 | 73 2 | 58 2 | 22(6 rows)akendb&＃61;#

--测试语句&＃xff1a;业务期望是想得出两表合并后根据id排序前面的两条记录&＃xff0c;即tab01中(id&＃61;1,num_col01&＃61;100)和tab02中的(id&＃61;1,num_col01&＃61;73)。

(select * from tab01 )

union all

(select * from tab02)

order by id asc limit 2;

akendb&＃61;# (select * from tab01 ) akendb-# union all akendb-# (select * from tab02) akendb-# order by id asc limit 2; id | num_col01 ----&＃43;----------- 1 | 100 1 | 73(2 rows)akendb&＃61;#

接着我们对调一下量表的先后顺序&＃xff0c;除了记录的顺序不一样&＃xff0c;得到的结果是相同的两行数据。

(select * from tab02 )

union all

(select * from tab01)

order by id asc limit 2;

akendb&＃61;# (select * from tab02 ) akendb-# union all akendb-# (select * from tab01) akendb-# order by id asc limit 2; id | num_col01 ----&＃43;----------- 1 | 73 1 | 100(2 rows)akendb&＃61;#

依样画葫芦&＃xff0c;我们将order by和limit内推到union all各个字句中&＃xff0c;查询结果和上面的一致&＃xff0c;好像没什么问题。

(select * from tab01 order by id limit 2)

union all

(select * from tab02 order by id limit 2)

order by id asc limit 2;

(select * from tab02 order by id limit 2)

union all

(select * from tab01 order by id limit 2)

order by id asc limit 2;

akendb&＃61;# (select * from tab01 order by id limit 2) akendb-# union all akendb-# (select * from tab02 order by id limit 2) akendb-# order by id asc limit 2; id | num_col01 ----&＃43;----------- 1 | 100 1 | 73(2 rows)akendb&＃61;# (select * from tab02 order by id limit 2) akendb-# union all akendb-# (select * from tab01 order by id limit 2) akendb-# order by id asc limit 2; id | num_col01 ----&＃43;----------- 1 | 73 1 | 100(2 rows)akendb&＃61;#

细心的同学或许已经看出了其中的问题&＃xff0c;为了让问题更加明显&＃xff0c;我这里将order by字段的值改动一下&＃xff1a;让每个表或第一张表的order by字段重复值的数量大于limit n中的n&＃xff1a;

update tab01 set id&＃61;1;

update tab02 set id&＃61;2;

akendb&＃61;# update tab01 set id&＃61;1; --进行update之后id&＃61;1的行数为3&＃xff0c;大于limit 2取数范围。UPDATE 3akendb&＃61;# update tab02 set id&＃61;1;UPDATE 3akendb&＃61;#

首先&＃xff0c;直接执行原来的查询语句&＃xff1a;

(select * from tab01 )

union all

(select * from tab02)

order by id asc limit 2;

(select * from tab02 )

union all

(select * from tab01)

order by id asc limit 2;

akendb&＃61;# (select * from tab01 ) akendb-# union all akendb-# (select * from tab02) akendb-# order by id asc limit 2; id | num_col01 ----&＃43;----------- 1 | 45 1 | 100(2 rows)akendb&＃61;# (select * from tab02 ) akendb-# union all akendb-# (select * from tab01) akendb-# order by id asc limit 2; id | num_col01 ----&＃43;----------- 1 | 58 1 | 73(2 rows)akendb&＃61;#

上面执行结果和之前的查询结果不太一样了&＃xff0c;原因是union all中做order by实际上根据第一个表的字段在排序&＃xff0c;然后limit的取值实际上倾向于能取第一个结果集的limit n&＃xff0c;所以到底是tab01还是tab02在前&＃xff0c;其实在union all的应用场景里面是有所区别的。

akendb&＃61;# explain analyze (select * from tab01 ) union all (select * from tab02) order by id asc limit 2; QUERY PLAN --------------------------------------------------------------------------------------------------------------------- Limit (cost&＃61;110.40..110.41 rows&＃61;2 width&＃61;8) (actual time&＃61;0.031..0.033 rows&＃61;2 loops&＃61;1) -> Sort (cost&＃61;110.40..121.70 rows&＃61;4520 width&＃61;8) (actual time&＃61;0.030..0.030 rows&＃61;2 loops&＃61;1) Sort Key: tab01.id Sort Method: top-N heapsort Memory: 25kB -> Append (cost&＃61;0.00..65.20 rows&＃61;4520 width&＃61;8) (actual time&＃61;0.012..0.018 rows&＃61;6 loops&＃61;1) -> Seq Scan on tab01 (cost&＃61;0.00..32.60 rows&＃61;2260 width&＃61;8) (actual time&＃61;0.012..0.013 rows&＃61;3 loops&＃61;1) -> Seq Scan on tab02 (cost&＃61;0.00..32.60 rows&＃61;2260 width&＃61;8) (actual time&＃61;0.004..0.004 rows&＃61;3 loops&＃61;1) Planning time: 0.118 ms Execution time: 0.062 ms(9 rows)akendb&＃61;# explain analyze (select * from tab02 ) union all (select * from tab01) order by id asc limit 2; QUERY PLAN --------------------------------------------------------------------------------------------------------------------- Limit (cost&＃61;110.40..110.41 rows&＃61;2 width&＃61;8) (actual time&＃61;0.029..0.031 rows&＃61;2 loops&＃61;1) -> Sort (cost&＃61;110.40..121.70 rows&＃61;4520 width&＃61;8) (actual time&＃61;0.028..0.028 rows&＃61;2 loops&＃61;1) Sort Key: tab02.id Sort Method: top-N heapsort Memory: 25kB -> Append (cost&＃61;0.00..65.20 rows&＃61;4520 width&＃61;8) (actual time&＃61;0.010..0.016 rows&＃61;6 loops&＃61;1) -> Seq Scan on tab02 (cost&＃61;0.00..32.60 rows&＃61;2260 width&＃61;8) (actual time&＃61;0.010..0.011 rows&＃61;3 loops&＃61;1) -> Seq Scan on tab01 (cost&＃61;0.00..32.60 rows&＃61;2260 width&＃61;8) (actual time&＃61;0.003..0.004 rows&＃61;3 loops&＃61;1) Planning time: 0.110 ms Execution time: 0.058 ms(9 rows)akendb&＃61;#

接着&＃xff0c;我们先看看“优化”改写后的效果&＃xff1a;

(select * from tab01 order by id limit 2)

union all

(select * from tab02 order by id limit 2)

order by id asc limit 2;

(selt * from tab02 order by id limit 2)

union all

(select * from tab01 order by id limit 2)

order by id asc limit 2;

akendb&＃61;# (select * from tab01 order by id limit 2) akendb-# union all akendb-# (select * from tab02 order by id limit 2) akendb-# order by id asc limit 2; id | num_col01 ----&＃43;----------- 1 | 100 1 | 45(2 rows) akendb&＃61;# (select * from tab02 order by id limit 2) akendb-# union all akendb-# (select * from tab01 order by id limit 2) akendb-# order by id asc limit 2; id | num_col01 ----&＃43;----------- 1 | 73 1 | 58(2 rows)akendb&＃61;#

上面的输出结果&＃xff0c;看似和原句的结果保持一致&＃xff0c;事实上&＃xff0c;当第一张表的中order by字段的记录满足比第二张表的记录都小的时候&＃xff0c;那么这种内推到子句的改法是明显错误的&＃xff0c;比如下面这种情况&＃xff1a;

akendb&＃61;# select * from tab01; id | num_col01 ----&＃43;----------- 1 | 45 1 | 6 1 | 65(3 rows)akendb&＃61;# select * from tab02; id | num_col01 ----&＃43;----------- 2 | 13 2 | 16 2 | 82(3 rows)akendb&＃61;# (select * from tab01 order by id limit 2) union all (select * from tab02 order by id limit 2) order by id asc limit 3; id | num_col01 ----&＃43;----------- 1 | 45 1 | 6 2 | 13(3 rows)akendb&＃61;#

这里的查询结果就不应该出现第二张表的记录&＃xff0c;但因为内推改变了取数据的逻辑&＃xff0c;这是明显搞错了。

所以&＃xff0c;在union all之后执行order by取top n看似逻辑的理解上正确了&＃xff0c;但在实际查询结果却偏差了&＃xff0c;不少开发和运维的同学可能并没有觉察&＃xff0c;以前遇到过&＃xff0c;今儿再次遇到了&＃xff0c;简单记录一下。

推荐阅读

int
Python SQLAlchemy库的使用方法详解

本文详细介绍了Python中使用SQLAlchemy库的方法。首先对SQLAlchemy进行了简介，包括其定义、适用的数据库类型等。然后讨论了SQLAlchemy提供的两种主要使用模式，即SQL表达式语言和ORM。针对不同的需求，给出了选择哪种模式的建议。最后，介绍了连接数据库的方法，包括创建SQLAlchemy引擎和执行SQL语句的接口。 ... [详细]

蜡笔小新 2023-12-12 15:23:06
install
基于PgpoolII的PostgreSQL集群安装与配置教程

本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件，提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能，可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤，并提供了相关的官方参考地址。 ... [详细]

蜡笔小新 2023-12-14 19:10:25
install
rhel5.5搭建网关+LAMP+postfix+dhcp的步骤和配置方法

本文介绍了在rhel5.5操作系统下搭建网关+LAMP+postfix+dhcp的步骤和配置方法。通过配置dhcp自动分配ip、实现外网访问公司网站、内网收发邮件、内网上网以及SNAT转换等功能。详细介绍了安装dhcp和配置相关文件的步骤，并提供了相关的命令和配置示例。 ... [详细]

蜡笔小新 2023-12-14 17:13:20
text
Linux重启网络命令实例及关机和重启示例教程

本文介绍了Linux系统中重启网络命令的实例，以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法，以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]

蜡笔小新 2023-12-14 15:52:52
format
Oracle Database 10g许可授予信息及高级功能详解

本文介绍了Oracle Database 10g许可授予信息及其中的高级功能，包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明，指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]

蜡笔小新 2023-12-14 13:12:10
default
阿里云物联网 .NET Core 客户端 | CZGL.AliIoTClient：4. 设备上报属性

阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]

蜡笔小新 2023-12-14 12:40:20
default
Oracle中tnsnames.ora的作用和配置方法

本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取，用于解析LOCAL_LISTENER，并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例，并展示了listener.ora文件的内容。 ... [详细]

蜡笔小新 2023-12-14 07:44:06
java
Spring特性实现接口多类的动态调用详解

本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍，以及getBeansOfType方法的应用，解决了在实际工作中遇到的接口及多个实现类的问题。同时，文章还提到了SPI使用的不便之处，并介绍了借助ApplicationContext实现需求的方法。阅读本文，你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]

蜡笔小新 2023-12-14 03:24:19
java
Web学习历程记录（七）——Tomcat基本概念和配置

本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念，以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器，包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实，适合初学者了解Tomcat的基础知识。 ... [详细]

蜡笔小新 2023-12-13 17:08:24
java
VB.NET在线急等问题解决方法，如何统计数据库字段下的数据并显示在文本框里？

本文介绍了一个在线急等问题解决方法，即如何统计数据库中某个字段下的所有数据，并将结果显示在文本框里。作者提到了自己是一个菜鸟，希望能够得到帮助。作者使用的是ACCESS数据库，并且给出了一个例子，希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句，得到的结果是650，但不知道如何得到560。希望能够得到解决方案。 ... [详细]

蜡笔小新 2023-12-13 15:15:30
java
java 模拟get post请求_Java后台模拟发送http的get和post请求，并测试

个人学习使用：谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]

蜡笔小新 2023-12-13 14:20:23
java
Oracle seg,V$TEMPSEG_USAGE与Oracle排序的关系及使用方法

本文介绍了Oracle seg,V$TEMPSEG_USAGE与Oracle排序之间的关系，V$TEMPSEG_USAGE是V_$SORT_USAGE的同义词，通过查询dba_objects和dba_synonyms视图可以了解到它们的详细信息。同时，还探讨了V$TEMPSEG_USAGE的使用方法。 ... [详细]

蜡笔小新 2023-12-12 17:57:15
java
Windows7 64位系统安装PLSQL Developer的步骤和注意事项

本文介绍了在Windows7 64位系统上安装PLSQL Developer的步骤和注意事项。首先下载并安装PLSQL Developer，注意不要安装在默认目录下。然后下载Windows 32位的oracle instant client，并解压到指定路径。最后，按照自己的喜好对解压后的文件进行命名和压缩。 ... [详细]

蜡笔小新 2023-12-12 13:32:08
java
解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法

本文介绍了解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法，包括检查location配置是否正确、pass_proxy是否需要加“/”等。同时，还介绍了修改nginx的error.log日志级别为debug，以便查看详细日志信息。 ... [详细]

蜡笔小新 2023-12-12 13:19:04
char
Oracle存储过程写法小例子及已命名的异常

本文介绍了Oracle存储过程的基本语法和写法示例，同时还介绍了已命名的系统异常的产生原因。 ... [详细]

蜡笔小新 2023-12-11 15:10:15

打完BOSS好睡觉1998

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章