热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

MySQL8.0官方文档第八章优化(十四)——条件过滤

目录第八章优化(十四)——条件过滤8.2优化SQL语句8.2.1优化SELECT语句8.2.1.13条件过滤第八章优化(十四)

目录

  • 第八章 优化(十四)—— 条件过滤

    • 8.2 优化SQL语句
      • 8.2.1 优化 SELECT 语句
        • 8.2.1.13 条件过滤


第八章 优化(十四)—— 条件过滤


8.2 优化SQL语句


8.2.1 优化 SELECT 语句


8.2.1.13 条件过滤

在连接处理中,前缀行是那些在连接中从一个表传递到下一个表的行。通常,优化器会尝试在连接顺序的早期放置前缀行数较低的表,以防止行组合的数量迅速增加。如果优化器可以使用从一个表中选择并传递给下一个表的行上的条件信息,那么它就可以更准确地计算出行数的估计值,并选择最佳的执行计划。

在没有条件过滤的情况下,表的前缀行数会根据优化器选择的访问方法不同,基于WHERE子句所选择的行估计数进行估算。条件过滤使优化器可使用访问方法还没有考虑到的WHERE子句中的其他相关条件,从而改进其前缀行数的估计。例如,在连接的当前表中,尽管可能会有一个基于索引选择行的访问方法,也有可能还有该表的WHERE子句其他附加条件,所以,利用该附加条件,可以过滤掉(进一步限制)一些本来会传递给下一个表的符合条件的行数。

只有在以下情况下,条件才有助于过滤估计行数:

  • 它引用当前表。

  • 它依赖于一个常量值或连接序列中早期表中的值。

  • 它尚未被访问方法考虑到。

在EXPLAIN输出中,rows列表示所选访问方法的行估计值,而filtered列反映出条件过滤的效果。过滤的值表示为百分比。最大值是100,这意味着没有对行进行过滤。从100开始减小的值表示过滤的数量在增加。

前缀行数量(在连接中从当前表传递到下一个表的估计行数)是行和筛选比例的乘积。也就是说,前缀行数量是估计的行数,通过估计的过滤效果而减少。例如,如果行数为1000,而筛选比例为20%,则条件筛选使估计的行数1000减少为前缀行数1000× 20% = 1000 × 0.2 = 200。

考虑以下查询:

SELECT *FROM employee JOIN department ON employee.dept_no = department.dept_noWHERE employee.first_name = 'John'AND employee.hire_date BETWEEN '2018-01-01' AND '2018-06-01';

假设数据集具有以下特征:

  • 雇员表(employee)有1024行数据。

  • 部门表(department)有12行数据。

  • 两个表都在dept_no(部门编号)上创建了一个索引dept。

  • 雇员表中在名字(first_name)上有一个索引name。

  • 在employee.first_name上满足以下条件的有8行:

    employee.first_name = 'John'

  • 在employee.hire_date上满足以下条件的有150行:

    employee.hire_date BETWEEN '2018-01-01' AND '2018-06-01'

  • 满足以下两个条件的只有1行:

    employee.first_name = 'John'
    AND employee.hire_date BETWEEN '2018-01-01' AND '2018-06-01'

如果没有条件过滤,EXPLAIN会产生如下输出:

+----+------------+--------+------------------+---------+---------+------+----------+
| id | table | type | possible_keys | key | ref | rows | filtered |
+----+------------+--------+------------------+---------+---------+------+----------+
| 1 | employee | ref | name,h_date,dept | name | const | 8 | 100.00 |
| 1 | department | eq_ref | PRIMARY | PRIMARY | dept_no | 1 | 100.00 |
+----+------------+--------+------------------+---------+---------+------+----------+

对于employee表,使用name索引的访问方法将拾取与名字“John”匹配的8行。本次查询没有过滤(筛选为100%),所以,这些行都是下一个表的前缀行:前缀行数是行 × 过滤率 = 8 × 100% = 8。

通过条件过滤,优化器还会考虑访问方法没有考虑到的WHERE子句中的条件。在本例中,优化器使用启发式方法估计employee.hire_date的BETWEEN条件的过滤率为16.31%。因此,EXPLAIN会产生如下输出:

+----+------------+--------+------------------+---------+---------+------+----------+
| id | table | type | possible_keys | key | ref | rows | filtered |
+----+------------+--------+------------------+---------+---------+------+----------+
| 1 | employee | ref | name,h_date,dept | name | const | 8 | 16.31 |
| 1 | department | eq_ref | PRIMARY | PRIMARY | dept_no | 1 | 100.00 |
+----+------------+--------+------------------+---------+---------+------+----------+

现在的前缀行数为行数 × 过滤率 = 8 × 16.31% = 1.3,更能反映实际数据集。

通常,优化器不会计算最后连接表的条件筛选效果(前缀行计数减少),因为没有可传递行的下一个表。EXPLAIN出现了一个异常:为了提供更多信息,将对所有连接的表(包括最后一个表)计算过滤效果。

要控制优化器是否考虑额外的过滤条件,请使用optimizer_switch系统变量的condition_fanout_filter(条件展开过滤)标志(见8.9.2节“可切换优化”)。该标志在默认情况下是启用的,但想要抑制条件过滤,可以禁用它(例如,如果发现某个特定查询在不启用它的情况下会产生更好的性能)。

如果优化器高估了条件过滤的效果,则性能可能会比不使用条件过滤时差。在这种情况下,这些技术可能有助于:

  • 如果一个列没有索引,则对它创建索引,这样优化器就可以获得一些关于列值分布的信息,并可以改进它的行数估计。

  • 类似地,如果没有可用的列直方图信息,则生成直方图(参见第8.9.6节“优化器统计”)。

  • 更改连接顺序。实现这一点的方法包括连接顺序优化器提示(请参阅第8.9.3节“优化器提示”)、紧跟在SELECT之后的STRAIGHT_JOIN(直连接)以及STRAIGHT_JOIN连接操作符。

  • 禁用会话的条件筛选:

    SET optimizer_switch = 'condition_fanout_filter=off';

    或者,对于给定的查询,使用优化器提示:

    SELECT /*+ SET_VAR(optimizer_switch = 'condition_fanout_filter=off') */ ...

上一集 MySQL 8.0 官方文档 第八章 优化(十三)—— 块嵌套循环和批量键访问连接


推荐阅读
  • 本文介绍了如何在MySQL中将零值替换为先前的非零值的方法,包括使用内联查询和更新查询。同时还提供了选择正确值的方法。 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • 本文介绍了在MySQL8.0中如何查看性能并解析SQL执行顺序。首先介绍了查询性能工具的开启方法,然后详细解析了SQL执行顺序中的每个步骤,包括from、on、join、where、group by、having、select distinct、union、order by和limit。同时还介绍了虚拟表的概念和生成过程。通过本文的解析,读者可以更好地理解MySQL8.0中的性能查看和SQL执行顺序。 ... [详细]
  • IhaveconfiguredanactionforaremotenotificationwhenitarrivestomyiOsapp.Iwanttwodiff ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 高质量SQL书写的30条建议
    本文提供了30条关于优化SQL的建议,包括避免使用select *,使用具体字段,以及使用limit 1等。这些建议是基于实际开发经验总结出来的,旨在帮助读者优化SQL查询。 ... [详细]
  • ALTERTABLE通过更改、添加、除去列和约束,或者通过启用或禁用约束和触发器来更改表的定义。语法ALTERTABLEtable{[ALTERCOLUMNcolu ... [详细]
  • ubuntu用sqoop将数据从hive导入mysql时,命令: ... [详细]
  • 模板引擎StringTemplate的使用方法和特点
    本文介绍了模板引擎StringTemplate的使用方法和特点,包括强制Model和View的分离、Lazy-Evaluation、Recursive enable等。同时,还介绍了StringTemplate语法中的属性和普通字符的使用方法,并提供了向模板填充属性的示例代码。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 本文详细介绍了Spring的JdbcTemplate的使用方法,包括执行存储过程、存储函数的call()方法,执行任何SQL语句的execute()方法,单个更新和批量更新的update()和batchUpdate()方法,以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]
  • 本文讨论了在数据库打开和关闭状态下,重新命名或移动数据文件和日志文件的情况。针对性能和维护原因,需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况,以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]
  • 如何在php中将mysql查询结果赋值给变量
    本文介绍了在php中将mysql查询结果赋值给变量的方法,包括从mysql表中查询count(学号)并赋值给一个变量,以及如何将sql中查询单条结果赋值给php页面的一个变量。同时还讨论了php调用mysql查询结果到变量的方法,并提供了示例代码。 ... [详细]
author-avatar
额度v人_766
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有