当前位置: 开发笔记 > 数据库 > 正文

oracle标量子查询简介和表连接改写-mysql教程

作者：棉布缺嘴_621 | 来源：互联网 | 2017-05-12 15:28

之前小鱼就听过了标量子查询，不过对于其中的细节理解还是远远不够，借助一部分资料和自己测试对标量子查询做一点简单的分析和介绍。Oracle允许在select子句中包含单行子查询，这个也就是oracle的标量子查询，标量子查询有点类似于外连接，当使用到外连接时

之前小鱼就听过了标量子查询，不过对于其中的细节理解还是远远不够，借助一部分资料和自己测试对标量子查询做一点简单的分析和介绍。 Oracle允许在select子句中包含单行子查询，这个也就是oracle的标量子查询，标量子查询有点类似于外连接，当使用到外连接时

之前小鱼就听过了标量子查询，不过对于其中的细节理解还是远远不够，借助一部分资料和自己测试对标量子查询做一点简单的分析和介绍。


Oracle允许在select子句中包含单行子查询，这个也就是oracle的标量子查询，标量子查询有点类似于外连接，当使用到外连接时我们可以灵活的将其转化为标量子查询。
SQL> create table t1 as select * from all_users;
Table created.
SQL> create table t2 as select * from all_objects;
Table created.
SQL> select a.object_id,(select b.username from t1 b where a.owner=b.username) f

rom t2 a;
49812 rows selected.
Execution Plan

----------------------------------------------------------

Plan hash value: 1364172329
--------------------------------------------------------------------------

| Id  | Operation         | Name | Rows  | Bytes | Cost (%CPU)| Time     |

--------------------------------------------------------------------------

|   0 | SELECT STATEMENT  |      | 53276 |  1560K|   152   (1)| 00:00:02 |

|*  1 |  TABLE ACCESS FULL| T1   |     1 |    17 |     2   (0)| 00:00:01 |

|   2 |  TABLE ACCESS FULL| T2   | 53276 |  1560K|   152   (1)| 00:00:02 |

--------------------------------------------------------------------------
Predicate Information (identified by operation id):

---------------------------------------------------
   1 - filter("B"."USERNAME"=:B1)
Note

-----

   - dynamic sampling used for this statement
Statistics

----------------------------------------------------------

         13  recursive calls

          0  db block gets

       4282  consistent gets

          0  physical reads

          0  redo size

    1176699  bytes sent via SQL*Net to client

      37012  bytes received via SQL*Net from client

       3322  SQL*Net roundtrips to/from client

          0  sorts (memory)

          0  sorts (disk)

      49812  rows processed
标量子查询其实还是一个子查询，那么它究竟是如何查询的：首先走的是外部的查询，比如上一个sql语句执行计划，先全表扫描的T2 a，然后取T2 a表的每一行数据就去和T1 b去过滤，过滤条件是a.owner=b.username，如果符合则返回子查询的值，如果不符合则用null补充。当然这个时候还有个类似的filter去重的运算，对于t2 a中重复的数据行不用再去和t1 b去过滤。
而上面这个标量子查询的sql语句其实是等价于下面外连接sql语句的：

SQL> select a.object_id,b.username from t2 a,t1 b

  2  where a.owner=b.username(+)  ;
49812 rows selected.
Execution Plan

----------------------------------------------------------

Plan hash value: 535089106
------------------------------------------------------------------------------

| Id  | Operation             | Name | Rows  | Bytes | Cost (%CPU)| Time     |

------------------------------------------------------------------------------

|   0 | SELECT STATEMENT      |      | 53276 |  2445K|   155   (2)| 00:00:02 |

|*  1 |  HASH JOIN RIGHT OUTER|      | 53276 |  2445K|   155   (2)| 00:00:02 |

|   2 |   TABLE ACCESS FULL   | T1   |    23 |   391 |     2   (0)| 00:00:01 |

|   3 |   TABLE ACCESS FULL   | T2   | 53276 |  1560K|   152   (1)| 00:00:02 |

------------------------------------------------------------------------------
Predicate Information (identified by operation id):

---------------------------------------------------
   1 - access("A"."OWNER"="B"."USERNAME"(+))
Note

-----

   - dynamic sampling used for this statement
Statistics

----------------------------------------------------------

          9  recursive calls

          0  db block gets

       4043  consistent gets

          0  physical reads

          0  redo size

    1176659  bytes sent via SQL*Net to client

      37012  bytes received via SQL*Net from client

       3322  SQL*Net roundtrips to/from client

          2  sorts (memory)

          0  sorts (disk)

      49812  rows processed
而如果标量子查询中如果主查询的一行对应子查询返回有多个值，这个是不允许的

SQL> select a.username,b.object_id from t1 a,t2 b

  2  where a.username=b.owner(+);
29742 rows selected.
Execution Plan

----------------------------------------------------------

Plan hash value: 1823443478
---------------------------------------------------------------------------

| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |

---------------------------------------------------------------------------

|   0 | SELECT STATEMENT   |      | 53276 |  2445K|   155   (2)| 00:00:02 |

|*  1 |  HASH JOIN OUTER   |      | 53276 |  2445K|   155   (2)| 00:00:02 |

|   2 |   TABLE ACCESS FULL| T1   |    23 |   391 |     2   (0)| 00:00:01 |

|   3 |   TABLE ACCESS FULL| T2   | 53276 |  1560K|   152   (1)| 00:00:02 |

---------------------------------------------------------------------------
Predicate Information (identified by operation id):

---------------------------------------------------
   1 - access("A"."USERNAME"="B"."OWNER"(+))
Note

-----

   - dynamic sampling used for this statement
Statistics

----------------------------------------------------------

          7  recursive calls

          0  db block gets

       2726  consistent gets

          0  physical reads

          0  redo size

     654542  bytes sent via SQL*Net to client

      22294  bytes received via SQL*Net from client

       1984  SQL*Net roundtrips to/from client

          2  sorts (memory)

          0  sorts (disk)

      29742  rows processed
SQL> select a.username,(select b.object_id from t2 b where a.username=b.owner) f

rom t1 a;

select a.username,(select b.object_id from t2 b where a.username=b.owner) from t

1 a

                   *

ERROR at line 1:

ORA-01427: single-row subquery returns more than one row
这里由于a.username=b.owner，其中b.owner有多个相同的值，所以这里返回的b.object_id可能有多个值，这里就出现上述的ora-01427错误。
标量子查询中也可以有聚合函数的出现：

SQL> set autotrace traceonly;

SQL> select a.username,max(b.object_id) from t1 a,t2 b

  2  where a.username=b.owner(+)

  3  group by a.username;
23 rows selected.
Execution Plan

----------------------------------------------------------

Plan hash value: 577572187
----------------------------------------------------------------------------

| Id  | Operation           | Name | Rows  | Bytes | Cost (%CPU)| Time     |

----------------------------------------------------------------------------

|   0 | SELECT STATEMENT    |      | 53276 |  2445K|   159   (4)| 00:00:02 |

|   1 |  HASH GROUP BY      |      | 53276 |  2445K|   159   (4)| 00:00:02 |

|*  2 |   HASH JOIN OUTER   |      | 53276 |  2445K|   155   (2)| 00:00:02 |

|   3 |    TABLE ACCESS FULL| T1   |    23 |   391 |     2   (0)| 00:00:01 |

|   4 |    TABLE ACCESS FULL| T2   | 53276 |  1560K|   152   (1)| 00:00:02 |

----------------------------------------------------------------------------
Predicate Information (identified by operation id):

---------------------------------------------------
   2 - access("A"."USERNAME"="B"."OWNER"(+))
Note

-----

   - dynamic sampling used for this statement
Statistics

----------------------------------------------------------

         92  recursive calls

          0  db block gets

        777  consistent gets

        685  physical reads

          0  redo size

       1169  bytes sent via SQL*Net to client

        503  bytes received via SQL*Net from client

          3  SQL*Net roundtrips to/from client

          2  sorts (memory)

          0  sorts (disk)

         23  rows processed
SQL> select a.username,(select max(b.object_id) from t2 b where b.owner=a.userna

me) from t1 a;
23 rows selected.
Execution Plan

----------------------------------------------------------

Plan hash value: 367820
---------------------------------------------------------------------------

| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |

---------------------------------------------------------------------------

|   0 | SELECT STATEMENT   |      |    23 |   391 |     2   (0)| 00:00:01 |

|   1 |  SORT AGGREGATE    |      |     1 |    30 |            |          |

|*  2 |   TABLE ACCESS FULL| T2   |   533 | 15990 |   152   (1)| 00:00:02 |

|   3 |  TABLE ACCESS FULL | T1   |    23 |   391 |     2   (0)| 00:00:01 |

---------------------------------------------------------------------------
Predicate Information (identified by operation id):

---------------------------------------------------
   2 - filter("B"."OWNER"=:B1)
Note

-----

   - dynamic sampling used for this statement
Statistics

----------------------------------------------------------

          9  recursive calls

          0  db block gets

      15929  consistent gets

          0  physical reads

          0  redo size

       1206  bytes sent via SQL*Net to client

        503  bytes received via SQL*Net from client

          3  SQL*Net roundtrips to/from client

          0  sorts (memory)

          0  sorts (disk)

         23  rows processed
但是我们注意到上述标量子查询却存在一个问题，就是无法将子查询展开为表连接，换句话说无法采用灵活的hash join outer的关联方式。
关于标量子查询和表关联的性能简介：

如果主查询返回的数据较多，而子查询中又没有高效的索引，关联列对应的主查询表又没有较多的重复值，那么这个标量子查询的执行成本是很大的,如上面的标量子查询和外连接的sql语句中可以看出外连接IO成本要明显小于标量子查询。
但是标量子查询oracle内部确是有优化的，优化器cache了中间的结果,如果结果集不大，子查询中又有高效的索引，那么这个标量子查询可能会比常规的表关联更加高效。
小鱼列出几种常会涉及到的标量子查询和表连接的sql改写：

1 最简单的标量子查询

table :a(a1,a2),b(a1,b2)

select a2,(select b2 from b where b.a1=a.a1) from a
表连接：

select a2,b2 from a,b where a.a1=b.a1(+);
2 子查询中限制返回一行数据

table :a(a1,a2),b(a1,b2)

select a2,(select b2 from b where b.a1=a.a1 and rownum=1) from a
表连接：

SELECT a2, c.b2

  FROM a,

       (SELECT b2, ROW_NUMBER () OVER (PARTITION BY a1 ORDER BY a1) cn

          FROM b

         WHERE cn = 1) c

 WHERE a.a1 = c.b2(+);
3 子查询带有聚合函数

table :a(a1,a2),b(a1,b2)

select a2,(select sum(b2) from b where b.a1 = a.a1) from a
表连接1：

SELECT a2, bb.sum_value

  FROM a,

       (  SELECT SUM (b2) sum_value, a1

            FROM b

        GROUP BY a1) bb

 WHERE a.a1 = b.a1(+);

表连接2：

  SELECT a2, SUM (b2)

    FROM a, b

   WHERE a.a1 = b.a1(+)

GROUP BY a2;
4 查询中包括好几个标量子查询

table :a(a1,a2),b(a1,b2),c(a1,b2,c2)

SELECT a.a2,

       (SELECT c2

          FROM b, c

         WHERE b.a1 = a.a1 AND b.b2 = c.b2 AND ROWNUM = 1),

       (SELECT b2

          FROM b

         WHERE b.a1 = a.a1 AND ROWNUM = 1),

       (SELECT c2

          FROM c

         WHERE c.a1 = a.a1 AND ROWNUM = 1)

  FROM a
表连接：

SELECT a.a2,

       bb.c2,

       cc.b2,

       dd.c2

  FROM (SELECT c2,

               b.a1,

               ROW_NUMBER () OVER (PARTITION BY b.a1 ORDER BY b.a1) cnt

          FROM b, c

         WHERE b.b2 = c.b2 AND cnt = 1) bb,

       (SELECT b2, ROW_NUMBER () OVER (PARTITION BY a1 ORDER BY a1) cnt

          FROM b

         WHERE cnt = 1) cc,

       (SELECT c2, ROW_NUMBER () OVER (PARTITION BY a1 ORDER BY a1) cnt

          FROM c

         WHERE cnt = 1) dd,

       a

 WHERE a.a1 = bb.a1(+) AND a.a1 = cc.a1(+) AND a.a1 = dd.a1(+);

SELECT a2, (SELECT SUM (c2) FROM b, c WHERE b.a1 = a.a1 AND b.b2 = c.b2), (SELECT SUM (b2) FROM b WHERE b.a1 = a.a1), (SELECT SUM (c2) FROM c WHERE c.a1 = a.a1) FROM a 表连接： SELECT a2, bb.sum1, cc.sum2, dd.sum3 FROM ( SELECT SUM (c2) sum1, b.a1 FROM b, c WHERE b.b2 = c.b2 GROUP BY b.a1) bb, ( SELECT SUM (b2) sum2, a1 FROM b GROUP BY a1) cc, ( SELECT SUM (c2) sum3, a1 FROM c GROUP BY a1) dd, a WHERE a.a1 = bb.a1(+) AND a.a1 = cc.a1(+) AND a.a1 = dd.a1(+);

原文地址：oracle标量子查询简介和表连接改写, 感谢原作者分享。

推荐阅读

数据库
PHP 5.2.5 安装与配置指南

本文详细介绍了 PHP 5.2.5 的安装和配置步骤，帮助开发者解决常见的环境配置问题，特别是上传图片时遇到的错误。通过本教程，您可以顺利搭建并优化 PHP 运行环境。 ... [详细]

蜡笔小新 2024-12-27 19:05:41
insert
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
数据库
MyBatis：深入解析与应用

在当前众多持久层框架中，MyBatis（前身为iBatis）凭借其轻量级、易用性和对SQL的直接支持，成为许多开发者的首选。本文将详细探讨MyBatis的核心概念、设计理念及其优势。 ... [详细]

蜡笔小新 2024-12-27 12:17:16
数据库
DataGridView 保存时，为什么当前单元格的值无法保存？

在使用 DataGridView 时，如果在当前单元格中输入内容但光标未移开，点击保存按钮后，输入的内容可能无法保存。只有当光标离开单元格后，才能成功保存数据。本文将探讨如何通过调用 DataGridView 的内置方法解决此问题。 ... [详细]

蜡笔小新 2024-12-27 09:27:14
数据库
在 Linux 系统中部署 PostgreSQL 数据库

本文详细介绍了如何在 Linux 平台上安装和配置 PostgreSQL 数据库。通过访问官方资源并遵循特定的操作步骤，用户可以在不同发行版（如 Ubuntu 和 Red Hat）上顺利完成 PostgreSQL 的安装。 ... [详细]

蜡笔小新 2024-12-27 03:46:27
数据库
如何在PostgreSQL中查看数据表

本文将指导您使用pgAdmin工具连接到PostgreSQL数据库，并展示如何浏览和查找其中的数据表。通过简单的步骤，您可以轻松访问所需的表结构和数据。 ... [详细]

蜡笔小新 2024-12-26 19:55:24
insert
利用存储过程构建年度日历表的详细指南

本文将介绍如何使用SQL存储过程创建一个完整的年度日历表。通过实例演示，帮助读者掌握存储过程的应用技巧，并提供详细的代码解析和执行步骤。 ... [详细]

蜡笔小新 2024-12-26 18:20:17
insert
使用 SQLiteJDBC 和 HikariCP 实现 Java 程序连接 SQLite 数据库

本文介绍了如何通过 Maven 依赖引入 SQLiteJDBC 和 HikariCP 包，从而在 Java 应用中高效地连接和操作 SQLite 数据库。文章提供了详细的代码示例，并解释了每个步骤的实现细节。 ... [详细]

蜡笔小新 2024-12-26 17:34:42
sql
解决SQL Server动态SQL中LIKE语句参数传递导致无返回值的问题

在使用SQL Server进行动态SQL查询时，如果遇到LIKE语句无法正确返回预期结果的情况，通常是因为参数传递方式不当。本文将详细探讨这一问题，并提供解决方案及相关的技术背景。 ... [详细]

蜡笔小新 2024-12-26 17:02:33
insert
SQL 触发器实现视图插入操作

本文介绍如何通过创建替代插入触发器，使对视图的插入操作能够正确更新相关的基本表。涉及的表包括：飞机（Aircraft）、员工（Employee）和认证（Certification）。 ... [详细]

蜡笔小新 2024-12-26 15:53:40
数据库
MySQL缓存机制深度解析

本文详细探讨了MySQL的缓存机制，包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术，读者可以更好地优化数据库性能。 ... [详细]

蜡笔小新 2024-12-26 15:15:06
sql
Qt 环境下 SQLite 动态创建表的实现方法

SQLite 动态创建多个表的需求在网络上有不少讨论，但很少有详细的解决方案。本文将介绍如何在 Qt 环境中使用 QString 类轻松实现 SQLite 表的动态创建，并提供详细的步骤和示例代码。 ... [详细]

蜡笔小新 2024-12-26 15:11:34
sql
精选30本C# ASP.NET SQL中文PDF电子书合集

欢迎订阅我们的技术博客，获取更多关于C#、ASP.NET和SQL的最新资讯和资源。 ... [详细]

蜡笔小新 2024-12-26 13:54:47
oracle
MySQL 数据库迁移指南：从本地到远程及磁盘间迁移

本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移，包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机，以及解决迁移过程中可能遇到的问题。 ... [详细]

蜡笔小新 2024-12-26 13:21:38
数据库
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48

棉布缺嘴_621

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章