作者:夫功的美丽家园 | 来源:互联网 | 2014-07-13 17:52
过滤型局部范围扫描在日常应用开发过程中,经常会遇到需要判断满足某些查询条件的集合是否存在,其实这种操作本质上是一种特殊的过滤操作,既需要用一个集合为源,另一个集合为判断标准,使用这个判断标准...SyntaxHighlighter.all();
过滤型局部范围扫描
在日常应用开发过程中,经常会遇到需要判断满足某些查询条件的集合是否存在,其实这种操作本质上是一种特殊的过滤操作,既需要用一个集合为源,另一个集合为判断标准,使用这个判断标准作为过滤器去过滤源集合。 www.2cto.com
在执行这种操作过程中,最理想的执行方式是当遇到第一个满足条件的记录时就停止整个执行过程返回结果,因为此时已经确认了满足条件的集合的存在,如果此时批量数组已经被填充满,那么就可以作为结果返回了。这其实是在执行这种过滤操作的过程中使用了局部范围扫描。
但是在日常开发中,由于非常随意的编写实现这种过滤操作的语句,致使大部分操作并不能按照这种方式来执行,而是为了判断这种存在性,不恰当的进行了全局范围的数据扫描,致使查询性能低下。
我们看如下语句示例:
Select count(*) from item_tab where dept=’101’ and seq>100;
如果该语句返回的查询结果大于0,那么可以说明满足查询条件dept=’101’ and seq>100的集合存在。使用这种方式当然可以判断出集合的存在,但是使用者这种方式,却不得以要对满足条件的全部范围的数据进行扫描,这样在数据量较大的情况下,使得查询性能低下。
但是如果我们将上述语句换成下面这种写法:
Select 1 into :cnt from dual www.2cto.com
where exists(select ‘x’ from item_tab where dept=’101’ and seq>100);
使用这种方式来改写上面的语句,能在很短的时间内得到查询结果。因为这种方式的语句在执行时,子查询部分会以局部范围扫描的方式来执行,这都得益于exists谓词的作用,exists是检查子查询中的结果是否存在的布尔函数,如果存在就返回true,否则就返回false。因此当子查询遇到第一个满足条件记录时立刻结束,并通过主查询返回最终结果。通过上述语句所生成的执行计划中会出现FILTER执行计划,这也说明了此种查询是一种特殊的过滤操作(不同于传统的过滤操作,如果说传统的过滤操作成为“条件过滤”,那么此种过滤操作可以称为“集合过滤”)。
我想很多人都听说过,使用exists操作来执行SQL会取得很好的性能效果,尤其是通过使用exists或者not exists来替换in或者not in,更会取得非常好的效果。其实这种情况下就是局部范围扫描在发挥作用,而不是exists或者not exists有什么神奇功效,因此不能不假思索的到处使用exists或者not exists。
我们再来看一个判断某个集合不属于另外一个集合的例子,如下面语句所示:
Select ord_dept,ord_date,custno
From order where ord_date like ‘2010%’
Minus
Select ord_dept,ord_date,’12514’
From sales where custno=‘12514’’;
执行上述语句时会扫描每一行数据,并且需要通过扫描大范围数据来寻找并确认对应的数据行。因此要思考如何通过局部范围扫描来避免这种情况的发生,可以如下所示来改写语句:
Select ord_dept,ord_date,custno
From order x www.2cto.com
Where ord_date like ‘2010%’
And not exists(select * from sales y
Where y.ord_dept=x.ord_dept and y.ord_date=x.ord_date
And y.cusno=’12514’);
该查询在执行过程中,会使用局部范围扫描,而且满足驱动查询条件ord_date like ‘2010%’的数据范围很大,同时满足作为过滤条件的子查询的数据范围很小,因此满足相反的not exists的数据范围就会很大,所以根据局部范围扫描性能策略矩阵可知,最终的查询性能很高返回查询结果的速度很快。
摘自 javacoffe的专栏