当前位置: 开发笔记 > 后端 > 正文

数据库复习（8）查询优化

作者：可以吸的果冻Ci | 来源：互联网 | 2023-05-23 21:03

一、概述一个执行计划确切地定义了每个运算应使用的算法以及它们之间的执行应该如何协调。查询优化器的任务是产生一个查询计划&＃xff0c;与原关系表达式相同并且结果执行代价最小。产生查询执行计划分3步

一、概述

一个执行计划确切地定义了每个运算应使用的算法以及它们之间的执行应该如何协调。查询优化器的任务是产生一个查询计划&＃xff0c;与原关系表达式相同并且结果执行代价最小。
产生查询执行计划分3步走&＃xff1a;

产生逻辑上与给定表达式等价的表达式
对所产生的表达式以不同的方式做注释&＃xff0c;产生不同的查询计划
估计每一个执行计划的代价&＃xff0c;选择估计代价最小的一个

二、关系表达式转换的等价规则

用 $θ,θ1,θ2\theta,\theta_1,\theta_2$ 代表为此&＃xff0c; $L,L_1,L_2$ 代表属性列表&＃xff0c; $E,E_1,E_2$ 代表关系代数表达式&＃xff0c;r代表关系实例&＃xff0c;可以出现在所有E出现的地方&＃xff0c;则&＃xff1a;

合取选择运算可分解为单个选择运算的序列。改变换被称为 $σ\sigma$ 的级联&＃xff1a;
$σθ1∧θ2(E)&＃61;σθ1(σθ2(E))\sigma_{\theta_1\land\theta_2}(E)&＃61;\sigma_{\theta_1}(\sigma_{\theta_2}(E))$
选择运算满足交换律&＃xff08;commutative&＃xff09;&＃xff1a;
$σθ1(σθ2(E))&＃61;σθ2(σθ1(E))\sigma_{\theta_1}(\sigma_{\theta_2}(E))&＃61;\sigma_{\theta_2}(\sigma_{\theta_1}(E))$
一系列投影运算中只有最后有一个运算时必须的&＃xff0c;其余可省略&＃xff0c;该转换也可被称为 $∏\prod_{}$ 的级联&＃xff1a;
$∏L1(∏L2(...∏Ln(E)...))&＃61;∏L1(E)\prod_{L_1}(\prod_{L_2}(...\prod_{L_n}(E)...))&＃61;\prod_{L_1}(E)$
选择操作可与笛卡儿积以及 $θ\theta$ 连接相结合
$θ\theta$ 连接运算满足交换律&＃xff1a;
事实上如果考虑属性顺序时&＃xff0c;这一条定律并不成立
自然连接运算满足结合律&＃xff08;associative&＃xff09;&＃xff0c; $θ\theta$ 连接满足广义的结合律&＃xff1a;

上面的式子事实上意味着笛卡尔积也满足结合律
选择运算在下面两个调剂按下对 $θ\theta$ 连接运算也具有分配律&＃xff08;选择的下沉&＃xff09;&＃xff1a;
a. 当选择条件 $θ0\theta_0$ 中的所有属性只涉及参与链接运算的表达式之一&＃xff08;比如 $E_1$ 时&＃xff09;&＃xff0c;满足分配律

b. 当选择条件 $θ1\theta_1$ 只涉及 $E_1$ 的属性&＃xff0c;选择条件 $θ2\theta_2$ 只涉及 $E_2$ 的属性时&＃xff0c;满足分配律&＃xff1a;
投影运算在下面条件下对 $θ\theta$ 连接运算具有分配律&＃xff1a;
集合的并与交满足交换律&＃xff0c;单集合的差不满足交换律
集合的并于交满足结合律
选择运算对并、交、差运算具有分配律&＃xff1a;
投影运算对并运算具有分配律。

三、表达式结果集统计大小的估计

1. 统计数据阐述

数据库系统同目录存储了有关数据库关系的下列统计信息&＃xff1a;

$n_r$ &＃xff0c;关系r的元组数
$b_r$ &＃xff0c;包含关系r中元组的磁盘块数
$l_r$ &＃xff0c;关系r中每个元组的字节数
$f_r$ &＃xff0c;关系r的块因子&＃xff0c;也即一个磁盘块中能容纳关系r中元组的个数
$V (A, r)$ &＃xff0c;关系r中属性A中出现的非重复值个数。该值与 $∏A(r)\prod_A(r)$ 的大小相同&＃xff0c;如果A式关系r的主码&＃xff0c;则 $V (A, r)$ 等于 $n_r$ 。
需要的话&＃xff0c;V(A,r)可以针对某个属性集&＃xff0c;而非单独的属性来维护。

延申&＃xff1a;如果假设关系r的元组在物理上存储于一个文件中&＃xff0c;则有 $br&＃61;⌈nrfr⌉b_r&＃61;\lceil \frac{n_r}{f_r}\rceil$ 成立。
另外&＃xff0c;关于索引的统计信息&＃xff0c;如B&＃43;树索引的高度和索引中叶节点的页数&＃xff0c;也保存在目录中。

2.选择运算结果大小的估计

选择操作	分析	结果
$σA&＃61;a(r)\sigma_{A&＃61;a}(r)$	假设每个值出现概率相等&＃xff0c;则结果应该与元组数正比&＃xff0c;与重复值数量呈反比	$n_r/V(A,r)$
$σA≤v(r)\sigma_{A\leq v}(r)$	如果统计信息中保留了A属性下的最小值min(A,r)和最大值max(A,r)&＃xff0c;可以进行更精确的判断	$0forv≤min(A,r,nrforv≥max(A,r),nr⋅v−min(A,r)max(A,r)−min(A,r)otherwize.0\ for\ v\leq min(A,r,\\n_r\ for\ v\geq max(A,r),\\ n_r\cdot \frac{v-min(A,r)}{max(A,r)-min(A,r)}\ otherwize.$
$σθ1∧...∧θn(r)\sigma_{\theta_1\land...\land\theta_n}(r)$	对每一个合取项&＃xff0c;将 $σθi(r)\sigma_{\theta_i}(r)$ 的大小记为 $s_i$ &＃xff0c;那么某一个元组存在于这个自己的概率是 $sinr\frac{s_i}{n_r}$ ,那么如果这n个选择是互相独立的&＃xff0c;满足所有合取项选择的概率就是所有上述概率的乘积
$σθ1∨...∨θn(r)\sigma_{\theta_1\vee...\vee\theta_n}(r)$	析取项与合取项类似&＃xff0c;整体取反后每项取反即可得到
$σ¬θ(r)\sigma_{\neg\theta}(r)$	如果null值不存在&＃xff0c;结果就是总数减去正选择的数量	$nr−size(σθ(r))n_r-size(\sigma_\theta(r))$

3.连接的结果的大小估计

笛卡尔积 $r×sr\times s$ 包含 $n_r*n_s$ 个元组&＃xff0c;而每个元组占用 $l_r&＃43;l_s$ 个字节&＃xff0c;因此可计算出笛卡尔积的大小。
更难以估算的是自然连接的大小&＃xff0c;需要分情况讨论&＃xff0c;令 $r (R)$ 和 $s (S)$ 为两个关系&＃xff1a;

在这里插入图片描述

对于所有的 $θ\theta$ 连接&＃xff0c;对于估计上的方法与执行策略无关&＃xff0c;直接将其化为 $σθ(r×s)\sigma_\theta(r\times s)$ &＃xff0c;对一次选择和一次笛卡尔积做估计即可。

4. 其他运算结果集的大小估计

操作名称	描述	结果
$∏A(r)\prod_A(r)$	去除了重复元组	$V (A, r)$
$AGF(r)_A\mathcal{G}_F(r)$	对A的任意一个不同取值在其中总有且只有一个元组与其对应	$V (A, r)$
集合运算	将所有的几个运算携程关系谓词的合取/析取形式

推荐阅读

文件
delphi控件大全

本文章已收录于：delphi控件查询：http:www.torry.nethttp:www.jrsoftware.orgTb97最有名的工具条(ToolBar) ... [详细]

蜡笔小新 2024-09-30 11:49:36
文件
python自学教程哪里好,python比较好的教程

本文目录一览：1、想学python去哪里比较好？ ... [详细]

蜡笔小新 2024-09-30 11:08:52
server
开发网站你需要知晓的部分专用术语

　　越来越多的企业和个人都在拥有属于自己的网站门户，首当其冲的就是你得知晓几个网站方面的专业术语，先是中就有好多的客户不明白这些，造成误会是正常的，那不如我们对它有个大致的了解，这样就不容易感觉 ... [详细]

蜡笔小新 2024-09-30 23:46:58
server
SSL协议、TLS协议，使用哪一种更安全？

在金融银行业，保护机密信息的安全至关重要。由于财务记录完全通过在线数据库维护，因此实施保护客户、银行和金融机构免受黑客攻击的安全功能比以往任何时候都更加重要。安全套接字层(SSL) ... [详细]

蜡笔小新 2024-09-30 21:45:53
server
安卓系统上位机搭配科大讯飞核心板AEC的评估方法

获取原始语音系统图使用matlab生成一个测试用的单频信号，1KHz，1Vrmsclcclearall;closeall;f1000;%定义信号频 ... [详细]

蜡笔小新 2024-09-30 19:06:04
上传
我重新调整了上传的图片，但它仍然有很大的尺寸 - I resized uploaded images but it still have big size

Iusedtousethiscodetoresizetheuploadedimage,butwhenIcomparedthegeneratedimagewitho ... [详细]

蜡笔小新 2024-09-30 17:05:10
上传
泛圈企业云盘：打造高效灵活的协同平台提高企业办公效率

云计算作为一种新的模式，给企业信息化的发展带来了巨大的变化。其中，企业云盘是一种可以快速被接受的企业云应用，因为在企业云盘存储中，所有云服务带来的风险都会大大降低。将文档管理系统本 ... [详细]

蜡笔小新 2024-09-30 14:58:51
上传
关于redis:redis学习之事务

事务是通过MULTI命令开始的，在非事务状态下客户端发送的命令会被立刻执行，而在事务状态下，除了EXECWATCHDISCARD这几个命令外，redis会将命令保留在事务队列里。 ... [详细]

蜡笔小新 2024-09-30 13:51:04
上传
重学数据结构之链表篇

本文是重学数据结构系列文章的第二篇，本文和大家一起探讨链表的相关知识。重学数据结构之数组篇文章目录链表是怎么样的数据结构链表的特点常见的链表结构单链表双向链表循环链表链表or数组链 ... [详细]

蜡笔小新 2024-09-30 13:26:42
上传
ROC曲线原理及Python实现

受试者工作特征曲线（receiveroperatingcharacteristiccurve，简称ROC曲线），是比较两个分类模型好坏的可视化工具ROC曲线的作用：1.较容易地查出 ... [详细]

蜡笔小新 2024-09-30 12:36:58
上传
算法递推

DFS基本概念步骤优缺点典型例题递推基本概念直接或者间接调用自身的算法称为递归算法一般数据n ... [详细]

蜡笔小新 2024-09-30 12:02:17
上传
编程语言是从哪蹦出来的——大型伦理寻根现场

Hello，我是Alex007，一个热爱计算机编程和硬件设计的小白，为啥是007呢？因为叫Alex的人太多了，再加上每天007的生活，Alex007就诞生了。聊一聊编程到底是啥，怎 ... [详细]

蜡笔小新 2024-09-30 11:12:40
上传
c语言教程pdf微盘,C语言基础教程PDF

本文目录一览：1、《C语言程序设计第四版》pdf下载在线阅读全文，求百度网盘云资源 ... [详细]

蜡笔小新 2024-09-30 06:45:02
并发
Linux负载均衡LVS（IPVS）

一、LVS简介LVS是LinuxVirtualServer的简称，也就是Linux虚拟服务器,是一个由章文嵩博士发起的自由软件项目，现在已经是Linux ... [详细]

蜡笔小新 2024-09-29 19:25:58
并发
全民k歌导出音乐方法（包含未发布，已发布歌曲导的两种方法）

**一、首先来介绍未发布歌曲导出方法**这就很简单，基本大家都会我在这儿就给还不太清楚的童鞋简单做个指引1、打开QQ,找到我的文件2、找到SD卡3、按图示步骤3、图示这个.m4a就 ... [详细]

蜡笔小新 2024-09-29 18:48:39

可以吸的果冻Ci

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章