当前位置: 开发笔记 > 数据库 > 正文

数据库性能调优技术

作者：拍友2502882315 | 来源：互联网 | 2018-06-03 02:51

一、概述这些内容，我会在后续的几篇文章中进行详细的描述。在此之前，我们首先需要掌握如何理解数据库执行计划。这篇文章讲解只涉及单表操作的执行计划。达梦数据库、oracle数据库、sqlserver数据库都可以显示给定语句的执行计划。我详细分析了这三个数

一、概述这些内容，我会在后续的几篇文章中进行详细的描述。在此之前，我们首先需要掌握如何理解数据库执行计划。这篇文章讲解只涉及单表操作的执行计划。达梦数据库、oracle 数据库、sql server 数据库都可以显示给定语句的执行计划。我详细分析了这三个数

一、概述

这些内容，我会在后续的几篇文章中进行详细的描述。在此之前，我们首先需要掌握如何理解数据库执行计划。这篇文章讲解只涉及单表操作的执行计划。达梦数据库、oracle 数据库、sql server 数据库都可以显示给定语句的执行计划。我详细分析了这三个数据库的执行计划，三者之间并无本质区别。所以本文的内容适合于这三个数据库。同样，也应该适合绝大多数其它的数据库。

单表执行的深入理解，是了解多表执行计划的基础。达梦数据库显示的执行计划时显示的信息会多一些。因此，这篇文章中我选择达梦数据库作为实例数据库来讲解执行计划的原理。读完本文后，应该能够读懂这三个数据库的单表执行计划。

二、深入理解数据库执行计划

达梦数据库的执行计划有两种显示方式：第一种为图形化的显示方式；第二种为文本式的显示方式。这里采用第二种方式进行讲解。理解执行计划，是迈向理解数据库性能调优的重要一步。从执行计划中，我们可以看出数据库是如何执行查询语句，并根据执行计划判断出该查询语句的执行是否高效，以及如何进行优化。

下面我们将通过一些例子来理解数据库执行计划。

1.没有索引的全表扫描过滤如何执行？

构造处执行场景：

create table t1(c1 int,c2 int);

insert into t1 values(1,1);

insert into t1 values(2,2);

insert into t1 values(3,3);

insert into t1 values(4,4);

insert into t1 values(5,5);

insert into t1 values(6,6);

查询语句为：

select * fromt1 wherec1=2;

该语句的执行过程，如果用语言描述可以描述成这样：

1）如果是第一次执行该步骤，则取得表的第一条记录；否则取得当前记录的下一条记录。如果记录已经扫描结束，则执行步骤 4，否则执行步骤 2。

2）判断该记录是否满足过滤条件c1=2，满足则执行步骤 3，否则执行步骤 1。

3）把该记录放到结果集中，执行步骤1。

4）将结果集返回给客户端。

实际上，数据库执行查询语句的过程也是类&＃20284;的，下面是该查询语句的执行计划：

#RSET:[21, 1, 1];

#XFLT:[0, 0, 0]; EXPR0 = 2

#CSEK:[21, 1, 1]; INDEX33555545(T1),FULL_SCAN

该执行计划中出现的内容，在此做出解释：

1)CSEK（查找）类&＃20284;于上文中描述的步骤1，方括号中的内容是执行该操作的评估代价，本文不作分析。“INDEX33555545(T1)”说明使用了 T1 表的聚集索引， “FULL_SCAN”表示对聚集索引 INDEX33555545(T1)进行全扫描。这里需要注意的是，达梦数据库中的表默认情况下是索引组织的。如果建表时指定了 cluster primary key，那么数据以该 clsuter primary key 组织数据，否则以 rowid 组织数据。

2）XFLT（过滤）类&＃20284;于上文中描述的步骤 2，“EXPR0 = 2”是过滤条件。

3）RSET（结果集）类&＃20284;于上文中描述的步骤 3，用来存放符合条件的记录集。

我们可以看出，数据库的执行过程和我们用语言描述的步骤是一致的。

该查询语句完整的执行流程如下：

1）CSEK 取得第一条记录（1，1）传给 XFLT，将控制权传给 XFLT。

2）XFLT 发现该记录（1，1）不符合条件，将控制权传给 CSEK。

3）CSEK 取得下一条记录（2，2）传给 XFLT，将控制权传给 XFLT。

4）XFLT 发现记录（2，2）符合条件，将该记录传给 RSET，将控制权传给 RSET。

5）RSET 将记录（2，2）放入结果集，将控制权传给 XFLT。

6）XFLT 给控制权传给 CSEK。

7）CSEK 取得下一条（3，3）传给 XFLT，将控制权传给 XFLT。

8）XFLT 发现该记录（3，3）不符合条件，将控制权传给 CSEK。

9）CSEK 取得下一条（4，4）传给 XFLT，将控制权传给 XFLT。

10）XFLT 发现该记录（4，4）不符合条件，将控制权传给 CSEK

11）CSEK 取得下一条（5，5）传给 XFLT，将控制权传给 XFLT。

12）XFLT 发现该记录（5，5）不符合条件，将控制权传给 CSEK。

13）CSEK 取得下一条（6，6）传给 XFLT，将控制权传给 XFLT。

14）XFLT 发现该记录（6，6）不符合条件，将控制权传给 CSEK。

15）CSEK 发现描述操作已经结束，通知 XFLT 结束。将控制权传给 XFLT。

16）XFLT 得知查询操作结束，通知 RSET 结束。将控制权传给 RSET。

17）RSET 得知操作结束。

18）发送结果集（包含记录（2，2））给客户端。

2.如果表 t1 上的 c1 列有非唯一索引，如何执行呢？

表 t1 的定义以及数据和 1 中描述的一样。

创建索引： create index it1_c1 on t1(c1);

查询语句“select* from t1 where c1=2;”对应的执行计划为：

#RSET:[201, 2, 1];

#CSEK(SECOND):[201, 2, 1]; IT1C1(T1), INDEX_EQU_SEARCH

CSEK 行的“SECOND”表示使用非聚集索引“IT1C1”，对该索引进行索引等&＃20540;（INDEX_EQU_SEARCH）查找。

该执行计划的执行流程为：

1）CSEK 使用 c1=2 查找非聚集索引，得到第一条 c1=2 的索引记录（2，rowid1）中的 rowid1（为数&＃20540;）。使用 rowid1 查找聚集索引得到对应的数据记录（2，2）传递给 RSET，将控制权传给 RSET。

2）RSET 将记录（2，2）放入结果集，将控制权传给CSEK。（因为 c1 上的索引是非唯一的，所以可能出现两条以上的记录满足c1=2，所以需要将控制权传给CSEK）。

3）CSEK 取得当前非聚集记录的下一条记录（3，rowid2），因为3!=2，所以扫描结束。将控制权传给RSET。（如果满足 c1=2 的记录数大于1条，需要继续传递记录给 RSET，以此类推，直到遇到不满足c1=2 的那条记录，结束操作。）

4）RSET 得知操作结束。

5）发送结果集（包含记录（2，2））给客户端。

3.如果表 t1 上的 c1 列有唯一索引，如何执行呢？

首先删除 c1 列上的非唯一索引，然后在 c1 列上创建唯一索引：

drop indexit1 c1;

create uniqueindex uit1 c1 on t1(c1);

查询语句“select* from t1 where c1=2;”对应的执行计划为：

#RSET:[201, 2, 1];

#CSEK(SECOND):[201, 2, 1]; UIT1C1(T1), INDEX_EQU_SEARCH

该执行计划的执行流程为：

1）CSEK 使用 c1=2 查找非聚集索引，得到 c1=2 的索引记录（2，rowid1）中的rowid1（为数&＃20540;）。使用 rowid1 查找聚集索引得到对应的数据记录（2，2）传递给 RSET，将控制权传给 RSET。（当然，有人也许会问，如果没有记录满足 c1=2怎么办呢？那么，此处什么记录都不传递给RSET，通知RSET查询操作结束，最后返回空集给客户端）。

2）RSET 将记录（2，2）放入结果集，操作结束（因为是唯一索引，所以最多只有 1 条记录满足 c1=2）。

3）发送结果集（包含记录（2，2））给客户端。

这里我们发现，例3使用了唯一索引，例2使用了非唯一索引。例3的执行速度大于例2的执行速度。

4.如何理解执行计划中的 top n 操作？

查询语句“select top 10 * from t1 wherec1>2;”对应的执行计划为：

#RSET:[21, 1, 1];

#XTOP:[0, 0, 0]; top_off(0), top_num(10)

#XFLT:[0, 0, 0]; EXPR1 > 2

#CSEK:[21, 1, 1]; INDEX33555545(T1),FULL_SCAN

XTOP（取得前 N 条记录）：将 XFLT 操作符传递来的记录放入到 RSET（结果集）中，并判断记录数是否已经等于给定&＃20540; 10（语句中的 top 10）。如果已经等于 10，则查询已经执行成功，退出。否则将控制权限传给 XFLT，继续执行。依次执行，直到取得 10 条记录，或者表CSEK操作已经查询结束（即符合条件的记录不满 10 条）。

5.如何理解执行计划中的 order by 操作？

查询语句“select top 10 * from t1 where c2>2order by c1;”对应的执行计划为：

#RSET:[21, 1, 1];

#XSORT:[0, 0, 0]; keys_num(1),is_distinct(FALSE)

#XFLT:[0, 0, 0]; EXPR1 > 2

#CSEK:[21, 1, 1]; INDEX33555545(T1),FULL_SCAN

XSORT（对记录进行排序）：将 XFLT 操作符传递来的记录插入到 XSORT 维护的临时空间中的合理位置，按 c1 进行有序排列。然后将控制权传给 XFLT 以取得下一条符合条件的记录。等处理完所有符合条件的记录。XSORT操作符才会将控制权限传给 RSET。

6．是不是查询语句中一旦出现 order by 字句，执行计划中就会出现 XSORT 操作

符？

不是。比如，查询语句“selectc1 from t1 order by c1;”对应的执行计划为：

#RSET:[0, 0, 0];

#CSEK:[0, 0, 0]; UIT1C1(T1), FULL_SCAN

从执行中我们可以看出，达梦直接对索引 UIT1C1进行全索引扫描，对于得到的每一条记录不需要进行 XSORT 排序操作，直接放入 RSET（结果集）中。因为索引 UIT1C1 本身就是按照 c1 进行排序的。

7．有文档说，对于语句“select max(c1) from t1”，可以在 c1 列上创建索引从而查询速度变快。那么在执行计划中是如何体现的呢？

查询语句“selectmax(c1) from t1”对应的执行计划：

#RSET:[0, 0, 0];

#XEVL:[0, 0, 0];

#FAGR:[0, 0, 0]; function_num(1)

在这个执行计划中，我们没有看到 CSEK 操作符。因为 c1 上存在索引 UIT1C1，该索引叶子节点的最右端就是 c1 的最大&＃20540;。FARG 直接返回该最大&＃20540;。语句“select min(c1) from t1;”、语句“select count(*) fromt1;”的执行原理一样。XEVL是表达式计算，本文不进行讲解。

8．如果列上存在索引，如何理解中的 group by 操作？

查询语句“selectc1,count(*) from t1 where c1>=2 group by c1;”对应的执行计划为：

#RSET:[11, 1, 1];

#XEVL:[0, 0, 0];

#SAGR:[0, 0, 0]; group_by_num(1),function_num(1)

#CSEK:[11, 1, 1]; UIT1C1(T1), INDEX_GE_SEARCH

我们可以得到，CSEK使用了索引UIT1C1进行了范围查找。首先传递给SARG的是连续的 c1=2 的记录组，然后是 c1=3 的记录组，然后是 c1=4 的记录组，……

此处 SARG 的执行流程是

1）从 CSEK 取得一条 c1=2 记录，将计数加 1，

2）从 CSEK 取得下一条记录，如果该记录满足 c1，将计数&＃43;1。

3）重复执行步骤 2，直到取得第一条不满足 c1=2 的记录，将(2,对应的计算)传递给 XEVL，再传给 RSET（结果集）。接着对 c1=3 的记录组执行同样的流程。依此类推，直到处理完所有符合条件的记录。

这里我们的分组函数是count(*)，如果是其它的分组函数，处理过程类&＃20284;。

9．如果列上不存在索引，如何理解中的 group by 操作？

查询语句“selectc2,count(*) from t1 where c2>=2group by c2;”对应的执行计划为：

#RSET:[21, 1, 1];

#XEVL:[0, 0, 0];

#HAGR:[0, 0, 0]; group_by_num(1),function_num(1)

#XFLT:[0, 0, 0]; EXPR0 >= 2

#CSEK:[21, 1, 1]; INDEX33555550(T1),FULL_SCAN

这里因为 c2 上没有索引，HARG 的作用是 HASH 分组。

HARG 的执行流程是：

1）从 XFLT 取得一条记录

2）记录的 c1=m，如果在 hash 表中已经对应项，计数&＃43;1，如果不存在对应项，在创建一个新的 hash 项。

3）所有的符合过滤条件的记录处理完成之后，HARG 才会将控制权限传给上层操作符，HARG 每次向上层操作符传递一条（m,m 对应的计数）。

这里我们的分组函数是 count(*)，如果是其它的分组函数，处理过程类&＃20284;。

推荐阅读

nosql
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新 2024-12-28 12:22:34
sql
探索libpq：连接PostgreSQL后端的深度解析（一）

本文详细介绍了如何使用libpq库与PostgreSQL后端建立连接。通过探讨PQconnectdb()函数的工作原理及其在实际应用中的使用方法，帮助读者理解并掌握建立高效、稳定的数据库连接的关键步骤。 ... [详细]

蜡笔小新 2024-12-28 10:40:46
sql
深入解析HTML中的标签及其应用场景

本文详细介绍了HTML中标签的使用方法和作用。通过具体示例，解释了如何利用标签为网页中的缩写和简称提供完整解释，并探讨了其在提高可读性和搜索引擎优化方面的优势。 ... [详细]

蜡笔小新 2024-12-27 17:05:37
sql
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
database
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
sql
使用C#开发SQL Server存储过程的指南

本文介绍如何利用C#在SQL Server中创建存储过程，涵盖背景、步骤和应用场景，旨在帮助开发者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-12-27 14:24:17
oracle
探索适用于Spring Boot的Web版SQL管理工具

本文探讨了适用于Spring Boot应用程序的Web版SQL管理工具，这些工具不仅支持H2数据库，还能够处理MySQL和Oracle等主流数据库的表结构修改。 ... [详细]

蜡笔小新 2024-12-27 14:21:10
database
网站与MySQL数据库的连接与交互

本文详细介绍了如何通过多种编程语言（如PHP、JSP）实现网站与MySQL数据库的连接，包括创建数据库、表的基本操作，以及数据的读取和写入方法。 ... [详细]

蜡笔小新 2024-12-27 14:09:23
sql
MyBatis：深入解析与应用

在当前众多持久层框架中，MyBatis（前身为iBatis）凭借其轻量级、易用性和对SQL的直接支持，成为许多开发者的首选。本文将详细探讨MyBatis的核心概念、设计理念及其优势。 ... [详细]

蜡笔小新 2024-12-27 12:17:16
sql
DataGridView 保存时，为什么当前单元格的值无法保存？

在使用 DataGridView 时，如果在当前单元格中输入内容但光标未移开，点击保存按钮后，输入的内容可能无法保存。只有当光标离开单元格后，才能成功保存数据。本文将探讨如何通过调用 DataGridView 的内置方法解决此问题。 ... [详细]

蜡笔小新 2024-12-27 09:27:14
sql
在 Linux 系统中部署 PostgreSQL 数据库

本文详细介绍了如何在 Linux 平台上安装和配置 PostgreSQL 数据库。通过访问官方资源并遵循特定的操作步骤，用户可以在不同发行版（如 Ubuntu 和 Red Hat）上顺利完成 PostgreSQL 的安装。 ... [详细]

蜡笔小新 2024-12-27 03:46:27
sql
如何在PostgreSQL中查看数据表

本文将指导您使用pgAdmin工具连接到PostgreSQL数据库，并展示如何浏览和查找其中的数据表。通过简单的步骤，您可以轻松访问所需的表结构和数据。 ... [详细]

蜡笔小新 2024-12-26 19:55:24
sql
利用存储过程构建年度日历表的详细指南

本文将介绍如何使用SQL存储过程创建一个完整的年度日历表。通过实例演示，帮助读者掌握存储过程的应用技巧，并提供详细的代码解析和执行步骤。 ... [详细]

蜡笔小新 2024-12-26 18:20:17
sql
使用 SQLiteJDBC 和 HikariCP 实现 Java 程序连接 SQLite 数据库

本文介绍了如何通过 Maven 依赖引入 SQLiteJDBC 和 HikariCP 包，从而在 Java 应用中高效地连接和操作 SQLite 数据库。文章提供了详细的代码示例，并解释了每个步骤的实现细节。 ... [详细]

蜡笔小新 2024-12-26 17:34:42
sql
解决SQL Server动态SQL中LIKE语句参数传递导致无返回值的问题

在使用SQL Server进行动态SQL查询时，如果遇到LIKE语句无法正确返回预期结果的情况，通常是因为参数传递方式不当。本文将详细探讨这一问题，并提供解决方案及相关的技术背景。 ... [详细]

蜡笔小新 2024-12-26 17:02:33

拍友2502882315

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章