mysql更改执行计划_一次搞定各种数据库SQL执行计划｜原力计划

作者：手机用户2502937805 | 来源：互联网 | 2023-08-27 16:05

作者|董旭阳TonyDong出品|CSDN博客执行计划(executionplan，也叫查询计划或者解释计划)是数据库执行SQL语句的具体步骤，例如通过

作者 | 董旭阳TonyDong

出品 | CSDN 博客

执行计划(execution plan&＃xff0c;也叫查询计划或者解释计划)是数据库执行 SQL 语句的具体步骤&＃xff0c;例如通过索引还是全表扫描访问表中的数据&＃xff0c;连接查询的实现方式和连接的顺序等。如果 SQL 语句性能不够理想&＃xff0c;我们首先应该查看它的执行计划。本文主要介绍如何在各种数据库中获取和理解执行计划&＃xff0c;并给出进一步深入分析的参考文档。

现在许多管理和开发工具都提供了查看图形化执行计划的功能&＃xff0c;例如 MySQL Workbench、Oracle SQL Developer、SQL Server Management Studio、DBeaver 等&＃xff1b;不过我们不打算使用这类工具&＃xff0c;而是介绍利用数据库提供的命令查看执行计划。

我们先给出在各种数据库中查看执行计划的一个简单汇总&＃xff1a;

本文使用的示例表和数据可以点击链接《SQL 入门教程》示例数据库(https://tonydong.blog.csdn.net/article/details/86518676)。

MySQL 执行计划

MySQL 中获取执行计划的方法很简单&＃xff0c;就是在 SQL 语句的前面加上EXPLAIN关键字&＃xff1a;

EXPLAINSELECT e.first_name,e.last_name,e.salary,d.department_nameFROM employees e JOIN departments d ON (e.department_id &＃61; d.department_id) WHERE e.salary > 15000;

执行该语句将会返回一个表格形式的执行计划&＃xff0c;包含了 12 列信息&＃xff1a;

id|select_type|table|partitions|type |possible_keys |key |key_len|ref |rows|filtered|Extra |--|-----------|-----|----------|------|-----------------|-------|-------|--------------------|----|--------|-----------|1|SIMPLE |e | |ALL |emp_department_ix| | | | 107| 33.33|Using where| 1|SIMPLE |d | |eq_ref|PRIMARY |PRIMARY|4 |hrdb.e.department_id| 1| 100| |

MySQL 中的EXPLAIN支持 SELECT、DELETE、INSERT、REPLACE 以及 UPDATE 语句。

接下来&＃xff0c;我们要做的就是理解执行计划中这些字段的含义。下表列出了 MySQL 执行计划中的各个字段的作用&＃xff1a;

对于上面的示例&＃xff0c;只有一个 SELECT 子句&＃xff0c;id 都为 1&＃xff1b;首先对 employees 表执行全表扫描(type &＃61; ALL)&＃xff0c;处理了 107 行数据&＃xff0c;使用 WHERE 条件过滤后预计剩下 33.33% 的数据(估计不准确)&＃xff1b;然后针对这些数据&＃xff0c;依次使用 departments 表的主键(key &＃61; PRIMARY)查找一行匹配的数据(type &＃61; eq_ref、rows &＃61; 1)。

使用 MySQL 8.0 新增的 ANALYZE 选项可以显示实际执行时间等额外的信息&＃xff1a;

EXPLAIN ANALYZESELECT e.first_name,e.last_name,e.salary,d.department_nameFROM employees e JOIN departments d ON (e.department_id &＃61; d.department_id) WHERE e.salary > 15000;-> Nested loop inner join (cost&＃61;23.43 rows&＃61;36) (actual time&＃61;0.325..1.287 rows&＃61;3 loops&＃61;1) -> Filter: ((e.salary > 15000.00) and (e.department_id is not null)) (cost&＃61;10.95 rows&＃61;36) (actual time&＃61;0.281..1.194 rows&＃61;3 loops&＃61;1) -> Table scan on e (cost&＃61;10.95 rows&＃61;107) (actual time&＃61;0.266..0.716 rows&＃61;107 loops&＃61;1) -> Single-row index lookup on d using PRIMARY (department_id&＃61;e.department_id) (cost&＃61;0.25 rows&＃61;1) (actual time&＃61;0.013..0.015 rows&＃61;1 loops&＃61;3)

其中&＃xff0c;Nested loop inner join 表示使用嵌套循环连接的方式连接两个表&＃xff0c;employees 为驱动表。cost 表示估算的代价&＃xff0c;rows 表示估计返回的行数&＃xff1b;actual time 显示了返回第一行和所有数据行花费的实际时间&＃xff0c;后面的 rows 表示迭代器返回的行数&＃xff0c;loops 表示迭代器循环的次数。

关于 MySQL EXPLAIN 命令的使用和参数&＃xff0c;可以参考 MySQL 官方文档 EXPLAIN 语句(https://dev.mysql.com/doc/refman/8.0/en/explain.html)。

关于 MySQL 执行计划的输出信息&＃xff0c;可以参考 MySQL 官方文档理解查询执行计划(https://dev.mysql.com/doc/refman/8.0/en/execution-plan-information.html)。

Oracle 执行计划

Oracle 中提供了多种查看执行计划的方法&＃xff0c;本文使用以下方式&＃xff1a;

使用EXPLAIN PLAN FOR命令生成并保存执行计划&＃xff1b;显示保存的执行计划。首先&＃xff0c;生成执行计划&＃xff1a;

EXPLAIN PLAN FORSELECT e.first_name,e.last_name,e.salary,d.department_nameFROM employees e JOIN departments d ON (e.department_id &＃61; d.department_id) WHERE e.salary > 15000;

EXPLAIN PLAN FOR命令不会运行 SQL 语句&＃xff0c;因此创建的执行计划不一定与执行该语句时的实际计划相同。

该命令会将生成的执行计划保存到全局的临时表 PLAN_TABLE 中&＃xff0c;然后使用系统包 DBMS_XPLAN 中的存储过程格式化显示该表中的执行计划。以下语句可以查看当前会话中的最后一个执行计划&＃xff1a;

SELECT * FROM TABLE(DBMS_XPLAN.display);PLAN_TABLE_OUTPUT |--------------------------------------------------------------------------------------------|Plan hash value: 1343509718 ||--------------------------------------------------------------------------------------------|| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time ||--------------------------------------------------------------------------------------------|| 0 | SELECT STATEMENT | | 44 | 1672 | 6 (17)| 00:00:01 ||| 1 | MERGE JOIN | | 44 | 1672 | 6 (17)| 00:00:01 ||| 2 | TABLE ACCESS BY INDEX ROWID| DEPARTMENTS | 27 | 432 | 2 (0)| 00:00:01 ||| 3 | INDEX FULL SCAN | DEPT_ID_PK | 27 | | 1 (0)| 00:00:01 |||* 4 | SORT JOIN | | 44 | 968 | 4 (25)| 00:00:01 |||* 5 | TABLE ACCESS FULL | EMPLOYEES | 44 | 968 | 3 (0)| 00:00:01 ||--------------------------------------------------------------------------------------------| |Predicate Information (identified by operation id): |--------------------------------------------------- | | 4 - access("E"."DEPARTMENT_ID"&＃61;"D"."DEPARTMENT_ID") | filter("E"."DEPARTMENT_ID"&＃61;"D"."DEPARTMENT_ID") | 5 - filter("E"."SALARY">15000) |

Oracle 中的EXPLAIN PLAN FOR支持 SELECT、UPDATE、INSERT 以及 DELETE 语句。

接下来&＃xff0c;我们同样需要理解执行计划中各种信息的含义&＃xff1a;

Plan hash value 是该语句的哈希值。SQL 语句和执行计划会存储在库缓存中&＃xff0c;哈希值相同的语句可以重用已有的执行计划&＃xff0c;也就是软解析&＃xff1b;Id 是一个序号&＃xff0c;但不代表执行的顺序。执行的顺序按照缩进来判断&＃xff0c;缩进越多的越先执行&＃xff0c;同样缩进的从上至下执行。Id 前面的星号表示使用了谓词判断&＃xff0c;参考下面的 Predicate Information&＃xff1b;Operation 表示当前的操作&＃xff0c;也就是如何访问表的数据、如何实现表的连接、如何进行排序操作等&＃xff1b;Name 显示了访问的表名、索引名或者子查询等&＃xff0c;前提是当前操作涉及到了这些对象&＃xff1b;Rows 是 Oracle 估计的当前操作返回的行数&＃xff0c;也叫基数(Cardinality)&＃xff1b;Bytes 是 Oracle 估计的当前操作涉及的数据量Cost (%CPU) 是 Oracle 计算执行该操作所需的代价&＃xff1b;Time 是 Oracle 估计执行该操作所需的时间&＃xff1b;Predicate Information 显示与 Id 相关的谓词信息。access 是访问条件&＃xff0c;影响到数据的访问方式(扫描表还是通过索引)&＃xff1b;filter 是过滤条件&＃xff0c;获取数据后根据该条件进行过滤。在上面的示例中&＃xff0c;Id 的执行顺序依次为 3 -> 2 -> 5 -> 4- >1。首先&＃xff0c;Id &＃61; 3 扫描主键索引 DEPT_ID_PK&＃xff0c;Id &＃61; 2 按主键 ROWID 访问表 DEPARTMENTS&＃xff0c;结果已经排序&＃xff1b;其次&＃xff0c;Id &＃61; 5 全表扫描访问 EMPLOYEES 并且利用 filter 过滤数据&＃xff0c;Id &＃61; 4 基于部门编号进行排序和过滤&＃xff1b;最后 Id &＃61; 1 执行合并连接。显然&＃xff0c;此处 Oracle 选择了排序合并连接的方式实现两个表的连接。

关于 Oracle 执行计划和 SQL 调优&＃xff0c;可以参考 Oracle 官方文档《SQL Tuning Guide》(https://docs.oracle.com/en/database/oracle/oracle-database/19/tgsql/)。

SQL Server 执行计划

SQL Server Management Studio 提供了查看图形化执行计划的简单方法&＃xff0c;这里我们介绍一种通过命令查看的方法&＃xff1a;

SET STATISTICS PROFILE ON

以上命令可以打开 SQL Server 语句的分析功能&＃xff0c;打开之后执行的语句会额外返回相应的执行计划&＃xff1a;

SELECT e.first_name,e.last_name,e.salary,d.department_nameFROM employees e JOIN departments d ON (e.department_id &＃61; d.department_id) WHERE e.salary > 15000;first_name|last_name|salary |department_name|----------|---------|--------|---------------|Steven |King |24000.00|Executive |Neena |Kochhar |17000.00|Executive |Lex |De Haan |17000.00|Executive |Rows|Executes|StmtText |StmtId|NodeId|Parent|PhysicalOp |LogicalOp |Argument |DefinedValues |EstimateRows|EstimateIO |EstimateCPU|AvgRowSize|TotalSubtreeCost|OutputList |Warnings|Type |Parallel|EstimateExecutions|----|--------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------|------|------|--------------------|--------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------------------------------------------------|------------|------------|-----------|----------|----------------|----------------------------------------------------------------------|--------|--------|--------|------------------| 3| 1|SELECT e.first_name,e.last_name,e.salary,d.department_name FROM employees e JOIN departments d ON (e.department_id &＃61; d.department_id) WHERE e.salary > 15000 | 1| 1| 0| | | | | 2.9719627| | | | 0.007803641| | |SELECT | 0| | 3| 1| |--Nested Loops(Inner Join, OUTER REFERENCES:([e].[department_id])) | 1| 2| 1|Nested Loops |Inner Join |OUTER REFERENCES:([e].[department_id]) | | 2.9719627| 0| 0| 57| 0.007803641|[e].[first_name], [e].[last_name], [e].[salary], [d].[department_name]| |PLAN_ROW| 0| 1| 3| 1| |--Clustered Index Scan(OBJECT:([hrdb].[dbo].[employees].[emp_emp_id_pk] AS [e]), WHERE:([hrdb].[dbo].[employees].[salary] as [e].[salary]>(15000.00))) | 1| 3| 2|Clustered Index Scan|Clustered Index Scan|OBJECT:([hrdb].[dbo].[employees].[emp_emp_id_pk] AS [e]), WHERE:([hrdb].[dbo].[employees].[salary] as [e].[salary]>(15000.00)) |[e].[first_name], [e].[last_name], [e].[salary], [e].[department_id]| 3|0.0038657407| 2.747E-4| 44| 0.004140441|[e].[first_name], [e].[last_name], [e].[salary], [e].[department_id] | |PLAN_ROW| 0| 1| 3| 3| |--Clustered Index Seek(OBJECT:([hrdb].[dbo].[departments].[dept_id_pk] AS [d]), SEEK:([d].[department_id]&＃61;[hrdb].[dbo].[employees].[department_id] as [e].[department_id]) ORDERED FORWARD)| 1| 4| 2|Clustered Index Seek|Clustered Index Seek|OBJECT:([hrdb].[dbo].[departments].[dept_id_pk] AS [d]), SEEK:([d].[department_id]&＃61;[hrdb].[dbo].[employees].[department_id] as [e].[department_id]) ORDERED FORWARD|[d].[department_name] | 1| 0.003125| 1.581E-4| 26| 0.0035993|[d].[department_name] | |PLAN_ROW| 0| 3|

SQL Server 中的执行计划支持 SELECT、INSERT、UPDATE、DELETE 以及 EXECUTE 语句。

SQL Server 执行计划各个步骤的执行顺序按照缩进来判断&＃xff0c;缩进越多的越先执行&＃xff0c;同样缩进的从上至下执行。接下来&＃xff0c;我们需要理解执行计划中各种信息的含义&＃xff1a;

Rows 表示该步骤实际产生的记录数&＃xff1b;Executes 表示该步骤实际被执行的次数&＃xff1b;StmtText 包含了每个步骤的具体描述&＃xff0c;也就是如何访问和过滤表的数据、如何实现表的连接、如何进行排序操作等&＃xff1b;StmtId&＃xff0c;该语句的编号&＃xff1b;NodeId&＃xff0c;当前操作步骤的节点号&＃xff0c;不代表执行顺序&＃xff1b;Parent&＃xff0c;当前操作步骤的父节点&＃xff0c;先执行子节点&＃xff0c;再执行父节点&＃xff1b;PhysicalOp&＃xff0c;物理操作&＃xff0c;例如连接操作的嵌套循环实现&＃xff1b;LogicalOp&＃xff0c;逻辑操作&＃xff0c;例如内连接操作&＃xff1b;Argument&＃xff0c;操作使用的参数&＃xff1b;DefinedValues&＃xff0c;定义的变量值&＃xff1b;EstimateRows&＃xff0c;估计返回的行数&＃xff1b;EstimateIO&＃xff0c;估计的 IO 成本&＃xff1b;EstimateCPU&＃xff0c;估计的 CPU 成本&＃xff1b;AvgRowSize&＃xff0c;平均返回的行大小&＃xff1b;TotalSubtreeCost&＃xff0c;当前节点累计的成本&＃xff1b;OutputList&＃xff0c;当前节点输出的字段列表&＃xff1b;Warnings&＃xff0c;预估得到的警告信息&＃xff1b;Type&＃xff0c;当前操作步骤的类型&＃xff1b;Parallel&＃xff0c;是否并行执行&＃xff1b;EstimateExecutions&＃xff0c;该步骤预计被执行的次数&＃xff1b;对于上面的语句&＃xff0c;节点执行的顺序为 3 -> 4 -> 2 -> 1。首先执行第 3 行&＃xff0c;通过聚集索引(主键)扫描 employees 表加过滤的方式返回了 3 行数据&＃xff0c;估计的行数(3.0841121673583984)与此非常接近&＃xff1b;然后执行第 4 行&＃xff0c;循环使用聚集索引的方式查找 departments 表&＃xff0c;循环 3 次每次返回 1 行数据&＃xff1b;第 2 行是它们的父节点&＃xff0c;表示使用 Nested Loops 方式实现 Inner Join&＃xff0c;Argument 列(OUTER REFERENCES:([e].[department_id]))说明驱动表为 employees &＃xff1b;第 1 行代表了整个查询&＃xff0c;不执行实际操作。

最后&＃xff0c;可以使用以下命令关闭语句的分析功能&＃xff1a;

SET STATISTICS PROFILE OFF

关于 SQL Server 执行计划和 SQL 调优&＃xff0c;可以参考 SQL Server 官方文档执行计划。

PostgreSQL 执行计划

PostgreSQL 中获取执行计划的方法与 MySQL 类似&＃xff0c;也就是在 SQL 语句的前面加上EXPLAIN关键字&＃xff1a;

EXPLAINSELECT e.first_name,e.last_name,e.salary,d.department_nameFROM employees e JOIN departments d ON (e.department_id &＃61; d.department_id) WHERE e.salary > 15000;QUERY PLAN |----------------------------------------------------------------------|Hash Join (cost&＃61;3.38..4.84 rows&＃61;3 width&＃61;29) | Hash Cond: (d.department_id &＃61; e.department_id) | -> Seq Scan on departments d (cost&＃61;0.00..1.27 rows&＃61;27 width&＃61;15) | -> Hash (cost&＃61;3.34..3.34 rows&＃61;3 width&＃61;22) | -> Seq Scan on employees e (cost&＃61;0.00..3.34 rows&＃61;3 width&＃61;22)| Filter: (salary > &＃39;15000&＃39;::numeric) |

PostgreSQL 中的EXPLAIN支持 SELECT、INSERT、UPDATE、DELETE、VALUES、EXECUTE、DECLARE、CREATE TABLE AS 以及 CREATE MATERIALIZED VIEW AS 语句。

PostgreSQL 执行计划的顺序按照缩进来判断&＃xff0c;缩进越多的越先执行&＃xff0c;同样缩进的从上至下执行。对于以上示例&＃xff0c;首先对 employees 表执行全表扫描(Seq Scan)&＃xff0c;使用 salary > 15000 作为过滤条件&＃xff1b;cost 分别显示了预估的返回第一行的成本(0.00)和返回所有行的成本(3.34)&＃xff1b;rows 表示预估返回的行数&＃xff1b;width 表示预估返回行的大小(单位 Byte)。然后将扫描结果放入到内存哈希表中&＃xff0c;两个 cost 都等于 3.34&＃xff0c;因为是在扫描完所有数据后一次性计算并存入哈希表。接下来扫描 departments 并且根据 department_id 计算哈希值&＃xff0c;然后和前面的哈希表进行匹配(d.department_id &＃61; e.department_id)。最上面的一行表明数据库采用的是 Hash Join 实现连接操作。

PostgreSQL 中的EXPLAIN也可以使用 ANALYZE 选项显示语句的实际运行时间和更多信息&＃xff1a;

EXPLAIN ANALYZESELECT e.first_name,e.last_name,e.salary,d.department_nameFROM employees e JOIN departments d ON (e.department_id &＃61; d.department_id) WHERE e.salary > 15000;QUERY PLAN |----------------------------------------------------------------------------------------------------------------|Hash Join (cost&＃61;3.38..4.84 rows&＃61;3 width&＃61;29) (actual time&＃61;0.347..0.382 rows&＃61;3 loops&＃61;1) | Hash Cond: (d.department_id &＃61; e.department_id) | -> Seq Scan on departments d (cost&＃61;0.00..1.27 rows&＃61;27 width&＃61;15) (actual time&＃61;0.020..0.037 rows&＃61;27 loops&＃61;1) | -> Hash (cost&＃61;3.34..3.34 rows&＃61;3 width&＃61;22) (actual time&＃61;0.291..0.292 rows&＃61;3 loops&＃61;1) | Buckets: 1024 Batches: 1 Memory Usage: 9kB | -> Seq Scan on employees e (cost&＃61;0.00..3.34 rows&＃61;3 width&＃61;22) (actual time&＃61;0.034..0.280 rows&＃61;3 loops&＃61;1)| Filter: (salary > &＃39;15000&＃39;::numeric) | Rows Removed by Filter: 104 |Planning Time: 1.053 ms |Execution Time: 0.553 ms |

EXPLAIN ANALYZE通过执行语句获得了更多的信息。其中&＃xff0c;actual time 是每次迭代实际花费的平均时间(ms)&＃xff0c;也分为启动时间和完成时间&＃xff1b;loops 表示迭代次数&＃xff1b;Hash 操作还会显示桶数(Buckets)、分批数量(Batches)以及占用的内存(Memory Usage)&＃xff0c;Batches 大于 1 意味着需要使用到磁盘的临时存储&＃xff1b;Planning Time 是生成执行计划的时间&＃xff1b;Execution Time 是执行语句的实际时间&＃xff0c;不包括 Planning Time。

关于 PostgreSQL 的执行计划和性能优化&＃xff0c;可以参考 PostgreSQL 官方文档性能提示(https://www.postgresql.org/docs/12/performance-tips.html)。

SQLite 执行计划

SQLite 也提供了EXPLAIN QUERY PLAN命令&＃xff0c;用于获取 SQL 语句的执行计划&＃xff1a;

sqlite> EXPLAIN QUERY PLAN...> SELECT e.first_name,e.last_name,e.salary,d.department_name ...> FROM employees e ...> JOIN departments d ON (e.department_id &＃61; d.department_id) ...> WHERE e.salary > 15000;QUERY PLAN|--SCAN TABLE employees AS e&＃96;--SEARCH TABLE departments AS d USING INTEGER PRIMARY KEY (rowid&＃61;?)

SQLite 中的EXPLAIN QUERY PLAN支持 SELECT、INSERT、UPDATE、DELETE 等语句。

SQLite 执行计划同样按照缩进来显示&＃xff0c;缩进越多的越先执行&＃xff0c;同样缩进的从上至下执行。以上示例先扫描 employees 表&＃xff0c;然后针对该结果依次通过主键查找 departments 中的数据。SQLite 只支持一种连接实现&＃xff0c;也就是 nested loops join。

另外&＃xff0c;SQLite 中的简单EXPLAIN也可以用于显示执行该语句的虚拟机指令序列&＃xff1a;

sqlite> EXPLAIN...> SELECT e.first_name,e.last_name,e.salary,d.department_name ...> FROM employees e ...> JOIN departments d ON (e.department_id &＃61; d.department_id) ...> WHERE e.salary > 15000;addr opcode p1 p2 p3 p4 p5 comment---- ------------- ---- ---- ---- ------------- -- -------------0 Init 0 15 0 00 Start at 151 OpenRead 0 5 0 11 00 root&＃61;5 iDb&＃61;0; employees2 OpenRead 1 2 0 2 00 root&＃61;2 iDb&＃61;0; departments3 Rewind 0 14 0 004 Column 0 7 1 00 r[1]&＃61;employees.salary5 Le 2 13 1 (BINARY) 53 if r[1]<&＃61;r[2] goto 136 Column 0 10 3 00 r[3]&＃61;employees.department_id7 SeekRowid 1 13 3 00 intkey&＃61;r[3]8 Column 0 1 4 00 r[4]&＃61;employees.first_name9 Column 0 2 5 00 r[5]&＃61;employees.last_name10 Column 0 7 6 00 r[6]&＃61;employees.salary11 Column 1 1 7 00 r[7]&＃61;departments.department_name12 ResultRow 4 4 0 00 output&＃61;r[4..7]13 Next 0 4 0 0114 Halt 0 0 0 0015 Transaction 0 0 8 0 01 usesStmtJournal&＃61;016 Integer 15000 2 0 00 r[2]&＃61;1500017 Goto 0 1 0 00

关于 SQLite 的执行计划和优化器相关信息&＃xff0c;可以参考 SQLite 官方文档解释查询计划。