热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

oracle左连接没用_oracle嵌套循环和多结果集嵌套循环处理优化

概述嵌套循环连接处理的两个数据集被称为外部循环(outerloop,也就是驱动数据源,drivingrowsoulce)和内部循环〔innerloop)
概述

嵌套循环连接处理的两个数据集被称为外部循环(outer loop,也就是驱动数据源,driving row soulce )和内部循环〔 inner loop )。外部循环为左子节点,内部循环为右子节点。当外部循环执行一次的时候,内部循环需要针对外部循环返回的每条记录执行一次。


处理过程

外部循环称为外表或者驱动表,而内部循环称为内表或者被驱动表。

f6ac990e7e06bf968bce239d76b39d7b.png

嵌套循环连接处理过程

嵌套循环连接有以下几点特征:

口左子节点(外部循环)只会执行一次,而右子节点(内部循环)一般会执行很多次。

口在所有数据处理完之前,就可以返回结果集的第一条记录。

口可以有效利用索引来处理限制条件与连接条件。

口支持所有类型的连接。


两表连接

下面是个简单的两表嵌套循环连接的执行计划。同时也描述了如何使用提示1eading 与use_nl来强制使用嵌套循环连接。Leading提示要求先访问表tl ,也就是,它指定了哪张表作为外部循环表使用。use_nl提示指定了具体使用哪种连接方法来将内部循环返回的数据(表t2 )与表t1 连接起来。有必要指出的是:usenl 提示并没有引用表t1 。

SELECT /* + leading (t1) use_nl(t2) full(t1) full(t2)*/ * FROM t1 ,t2 WHERE tl.id =t2.id AND tl.n=19

7d9474d8c1fda97469e8bce98f355567.png

NESTED LOOPS操作是一种相关联合型操作。它意味着是第二个子节点(内部循环)的执行是由第一个子节点(外部循环)控制的。在这个例子中,执行计划的执行过程可以总结如下。

口 通过全表扫描访问表t1 的所有记录,访问中应用限制条件n = 19 过滤数据口

口 前面一个步骤返回多少条记录,就在表t2 上执行多少次全表扫描。

无疑,当操作2 返回的记录超过1 条时,这种执行计划就不是很有效了,因此,查询优化器几乎从来不会选择它。正是因为这个原因,才必须指定两个访问提示(full)来强制查询优化器使用这个执行计划。另一方面,如果外部循环只返回一条记录,并且内部循环的选择性也很高,对表t2 进行全表扫描可能也不错。为了展示这一点,下面我们在表t1 的n 字段卜创建一个唯一索引:

CREATE UNIQUE INDEX t1_n ON t1(n)

有了这个索引以后,前面的语句就以下面的执行计一划执行了。由于操作3 (INDEX UNIQUE SCAN)的缘故,可以确保内部循环只会被执行一次。

SELECT /* + leading (t1) use_nl(t2) index(t1) full(t2)*/ * FROM t1 ,t2 WHERE tl.id =t2.id AND tl.n=19

1c36d5220cd3ee70a17c5a56ffc47f43.png

如果内部循环的选择性很低,对内部循环适应索引扫描就是一个较好的选择。由于嵌套循环连接是相关联合型操作,对内部循环来讲,这个地方也可能利用到连接条件。例如,在下面的执行计划中,操作5就是利用操作3的返回值t1.id做了索引查找。

SELECT /* + leading (t1) use_nl(t2) index(t1) index(t2)*/ * FROM t1 ,t2 WHERE tl.id =t2.id AND tl.n=19

ebeaa5f637302e279ad178c54d515895.png

通过建立2个索引,使得性能得到最好的优化。嵌套循环适合2个选择性低的效率数据量的选择,到数据量大的时候优化器会默认选择hash join 连接,除非我们手动选择提示,并且通过索引来达到很好的效率。

总的来讲,如果内部循环会执行多次,只有具有好的选择性的访问路径以及导致比较少的逻辑读的路径才有意义


四表连接

下面的执行计划是个典型的用嵌套循环连接实现的左深树。请注意各个表是如何通过索引进行访问的ordered 提示要求这些表按它们在FROM 子句中的顺序进行访问。use_nl提示要求后面的表与第一张表(或者前面一个操作的结果集)进行连接的时候使用嵌套循环连接。

SELECT /* + ordered use_nl(t2 t3 t4)*/ t1.*,t2.*,t3.*,t4.* FROM t1,t2,t3,t4 WHERE t1.id = t2.t1_id AND t2.id =t3.t2_idAND t3.id =t4.t3_id AND t1.n = 19

edb00e34a69f0d5ab675f051e4b958b5.png

这种执行计划的执行流程可以总结如下(不考虑使用行预取的情况):

( 1)当读取第一条记录的时候(也就是说,不是当这条语句解析或者执行的时候),在应用了表t1 上的限制条件tl.n = 19 并取得第一条记录的时候,处理过程就开始了。( 2)表t2 基于表t1 找到的结果进行查找。数据库引擎会利用连接条件tl.id = t2.t1_id 来访问表t2。事实上.表t2 上没有任何限制条件。只有第一条满足连接条件的记录才会返回给上级操作。( 3)表t3 基于表t2 找到的结果进行查找数据库引擎也是利用连接条件t2.id =t3.t2_id 来访问表t3 。只有第一条满足连接条件的记录才会返回给上一级操作。( 4)表t4 基于表t3 找到的结果进行查找。这儿也一样,数据库引擎也是利用连接条件t3.id =t4.t3_id 来访问表t4 。满足条件的第一条记录会立即返回给客户端。( 5)后续的操作也是按照第一条记录样的行为来进行的。很明显,执行过程是在下一次匹配(也可能是表t4 里面匹配的第二条记录,如果有的话)的位置开始的。需要特别强调的是,满足条件的记录会在第一时间被返回给客户端。换句话讲,就是完全没有必要在返回第条记录之前完成整个执行过程。块预取

在一般情况下,当缓存没有命中的时候,基于单块处理(例如,rowid 访问、索引范围扫描)的访问路径会导致一个单块的物理读。对于嵌套循环连接来讲,特别是当有很多行数据需要处理的时候,效率会比较差。实际上很多时候,嵌套循环连接也会使用多个单块物理读来访问多个相邻的块。数据库引擎可以利用块预取功能来提高嵌套循环连接的效率。这种优化技巧的目的是,对与多个相邻的块使用一次多块物理读取,来代替多次单块物理读取。块预取对于表和索引都是适用的。无法通过查看执行计划来看出数据库引擎是否使用了块预取功能。唯一能够看到的方式是,查看服务器进程执行的物理读,特别是与物理读相关的等待事件。

口db file sequential read 是个与单块物理读取相关的事件。因此,如果这个事件出现,就意味着块预取要么没有被使用,要么是无法被使用(例如,由于请求的块己经在高速缓存中)。

口db file scattered read 是一个与多块物理读取相关的事件。因此.如果在~id 访问或者索引范围扫描中看到这个等待事件,就表明在使用块预取功能。

需要特别提示的是,我们无法控制块预取功能的使用。如何以及是否使用块预取功能是由数据库引擎决定的。

其他可选的执行计划可以用下面的执行计划来执行嵌套循环连接。

8d5c9c8fea5e789190cc6433967f6cb1.png

实际上,在Oracle 的最近几个版本中,只有当内部循环或者外部循环是基于唯一索引扫描(index unique scan )的时候才会使用这种类型的执行计划。下面我们来看看,如果在列n 上的索引t1_n 如下面这样定义(为非唯一)时会如何:

CREATE INDEX t1_n ON t1(n)

当换成这个索引时,下面的执行计划将被采用。请注意,表t2 上的rowid 访问是处在不同的位置的.在前一个执行计划,它是在操作4 ,然而在后一个执行计划中,它是在操作1 。比较特别的是,row 记访问(操作1)的子操作是一个嵌套循环连接(操作2 )。从我们的角度看,这两个执行计划做了同一件事。下面的这个执行计划可能是为了利用一些内部优化(比如块预取)。

e909c4993f8b0d8f36a0a1635243dbf0.png

在oracle 11g 中,可能会使用下面的执行计划,而不是之前的那个。注意,虽然查询始终是一个两表连接,执行计划却含有两个嵌套循环连接!

8cdc006ce61cf948e92c63c1af0187fd.png

oracle多结果集嵌套循环处理优化

--性能差begin for a in (select id,name,sex,idcard from people) loop for b in (select id,name,sex,idcard from english) loop if a.idcard = b.idcard then --do something end if; end loop; end loop;end;

优化后如下:

--性能优:将多表合并成一个结果集,避免嵌套循环begin for a in (select p.id,p.name,p.sex,p.idcard from people p,english e where p.idcard = e.idcard) loop --do something end loop;end;


关于嵌套循环方面的内容就介绍到这了,后面会分享更多DBA方面内容,感兴趣的朋友可以关注下 !

355b7471ca6b82e5cccb98ea0bda6b31.gif



推荐阅读
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • Centos下安装memcached+memcached教程
    本文介绍了在Centos下安装memcached和使用memcached的教程,详细解释了memcached的工作原理,包括缓存数据和对象、减少数据库读取次数、提高网站速度等。同时,还对memcached的快速和高效率进行了解释,与传统的文件型数据库相比,memcached作为一个内存型数据库,具有更高的读取速度。 ... [详细]
  • 基于PgpoolII的PostgreSQL集群安装与配置教程
    本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件,提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能,可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤,并提供了相关的官方参考地址。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文介绍了在Oracle数据库中创建序列时如何选择cache或nocache参数。cache参数可以提高序列的存取速度,但可能会导致序列丢失;nocache参数可以避免序列丢失,但在高并发访问时可能导致性能问题。文章详细解释了两者的区别和使用场景。 ... [详细]
  • 本文讨论了在数据库打开和关闭状态下,重新命名或移动数据文件和日志文件的情况。针对性能和维护原因,需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况,以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 本文介绍了Redis中RDB文件和AOF文件的保存和还原机制。RDB文件用于保存和还原Redis服务器所有数据库中的键值对数据,SAVE命令和BGSAVE命令分别用于阻塞服务器和由子进程执行保存操作。同时执行SAVE命令和BGSAVE命令,以及同时执行两个BGSAVE命令都会产生竞争条件。服务器会保存所有用save选项设置的保存条件,当满足任意一个保存条件时,服务器会自动执行BGSAVE命令。此外,还介绍了RDB文件和AOF文件在操作方面的冲突以及同时执行大量磁盘写入操作的不良影响。 ... [详细]
  • 本文介绍了Oracle存储过程的基本语法和写法示例,同时还介绍了已命名的系统异常的产生原因。 ... [详细]
  • Oracle :修改数据库服务器字符集 ... [详细]
  • 单页面应用 VS 多页面应用的区别和适用场景
    本文主要介绍了单页面应用(SPA)和多页面应用(MPA)的区别和适用场景。单页面应用只有一个主页面,所有内容都包含在主页面中,页面切换快但需要做相关的调优;多页面应用有多个独立的页面,每个页面都要加载相关资源,页面切换慢但适用于对SEO要求较高的应用。文章还提到了两者在资源加载、过渡动画、路由模式和数据传递方面的差异。 ... [详细]
author-avatar
佳麟钧君怡慧_481
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有