当前位置: 开发笔记 > 编程语言 > 正文

关系数据库之mysql三：从一条sql的生命周期说起

作者：90后的中老年人 | 来源：互联网 | 2020-12-07 13:12

mysql教程栏目介绍关系数据库的sql的生命周期。

连接器：

建立与 MySQL 的连接，用于查询SQL语句，判断权限。

查询缓存：

如果语句不在查询缓存中，就会继续后面的执行阶段。执行完成后，执行结果会被存入查询缓存中
如果查询命中缓存，MySQL不需要执行后面的复杂操作，就可以直接返回结果，提升效率

分析器：

对 SQL 语句进行硬解析，分析器先会做词法分析。分析SQL 语句的组成成分。判断输入的 SQL 语句是否满足语法规则。

优化器：

优化器是在表里面有多个索引的时候，决定使用哪个索引；或者在一个语句有多表关联（join）的时候，决定各个表的连接顺序。不同的执行方法的逻辑结果是一样的，但是执行的效率会有不同，而优化器的作用就是决定选择使用哪一个方案。

执行器：

有索引：第一次调用的是取满足条件的第一行这个接口，之后循环取满足条件的下一行这个接口，最终把查询结果返回客户端
无索引：调用 InnoDB 引擎接口取这个表的第一行，判断sql查询条件，如果不是则跳过，如果是则将这行存在结果集中；调用引擎接口取下一行，重复相同的判断逻辑，直到取到这个表的最后一行。执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端

理解执行计划

EXPLAIN命令输出MySQL将如何执行你的SQL语句，但不会返回数据

如何使用

[root@localhost][(none)]> explain select * from 表名 where project_id = 36;
+----+-------------+--------------------------+------------+------+---------------+------------+---------+-------+--------+----------+-------+
| id | select_type | table                    | partitions | type | possible_keys | key        | key_len | ref   | rows   | filtered | Extra |
+----+-------------+--------------------------+------------+------+---------------+------------+---------+-------+--------+----------+-------+
|  1 | SIMPLE      | 表名                     | NULL       | ref  | project_id    | project_id | 4       | const | 797964 |   100.00 | NULL  |
+----+-------------+--------------------------+------------+------+---------------+------------+---------+-------+--------+----------+-------+

id

id相同执行顺序由上至下
id不同，id值越大优先级越高，越先被执行

select_type

SIMPLE：简单的 select 查询，查询中不包含子查询或者 union
PRIMARY：查询中包含子部分，最外层查询则被标记为 primary
DERIVED：是子查询from的一部分
DEPENDENT SUBQUERY：子查询中的第一个SELECT，子查询依赖于外层查询的结果
SUBQUERY 表示在 select 或 where 列表中包含了子查询，
MATERIALIZED：表示 where 后面 in 条件的子查询
UNION：表示 union 中的第二个或后面的 select 语句
UNION RESULT：union 的结果

table

表对象

type

system > const > eq_ref > ref > range > index > ALL（查询效率）

system：表中只有一条数据，这个类型是特殊的const类型
const：针对于主键或唯一索引的等值查询扫描，最多只返回一个行数据。速度非常快，因为只读取一次即可。
eq_ref：此类型通常出现在多表的join查询，表示对于前表的每一个结果，都只能匹配到后表的一行结果，并且查询的比较操作通常是=，查询效率较高
ref：此类型通常出现在多表的join查询，针对于非唯一或非主键索引，或者是使用了最左前缀规则索引的查询
range：范围扫描这个类型通常出现在 <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, IN() 操作中
index：索引树扫描
ALL：全表扫描（full table scan）

possible_keys

可能使用的索引，注意不一定会使用
查询涉及到的字段上若存在索引，则该索引将被列出来
当该列为NULL时就要考虑当前的SQL是否需要优化了

key

显示MySQL在查询中实际使用的索引，若没有使用索引，显示NULL。
查询中若使用了覆盖索引(覆盖索引：索引的数据覆盖了需要查询的所有数据)，则该索引仅出现在key列表中

key_length

索引长度

ref

表示上述表的连接匹配条件，即哪些列或常量被用于查找索引列上的值

rows

返回估算的结果集数目，并不是准确的值

filtered

示返回结果的行数占需读取行数的百分比， filtered 的值越大越好

extra

Using where：表示优化器需要通过索引回表，之后到server层进行过滤查询数据
Using index：表示直接访问索引就足够获取到所需要的数据，不需要回表
Using index condition：在5.6版本后加入的新特性（Index Condition Pushdown）
Using index for group-by：使用了索引来进行GROUP BY或者DISTINCT的查询
Using filesort：当 Extra 中有 Using filesort 时, 表示 MySQL 需额外的排序操作, 不不能通过索引顺序达到排序效果. 一般有 Using filesort, 都建议优化去掉, 因为这样的查询 CPU 资源消耗大
Using temporary 临时表被使用，时常出现在GROUP BY和ORDER BY子句情况下。（sort buffer或者磁盘被使用）

光看 filesort 字面意思，可能以为是要利用磁盘文件进行排序，实则不全然。当MySQL不能使用索引进行排序时，就会利用自己的排序算法(快速排序算法)在内存(sort buffer)中对数据进行排序，如果内存装载不下，它会将磁盘上的数据进行分块，再对各个数据块进行排序，然后将各个块合并成有序的结果集（实际上就是外排序）。

当对连接操作进行排序时，如果ORDER BY仅仅引用第一个表的列，MySQL对该表进行filesort操作，然后进行连接处理，此时，EXPLAIN输出“Using filesort”；否则，MySQL必须将查询的结果集生成一个临时表，在连接完成之后行行filesort操作，此时，EXPLAIN输出“Using temporary;Using filesort”。

提高查询效率

正确使用索引

为解释方便，来一个demo：

DROP TABLE IF EXISTS user; 
CREATE TABLE user( 
id int AUTO_INCREMENT PRIMARY KEY, 
user_name varchar(30) NOT NULL, 
gender bit(1) NOT NULL DEFAULT b’1’, 
city varchar(50) NOT NULL, 
age int NOT NULL 
)ENGINE=InnoDB DEFAULT CHARSET=utf8;
ALTER TABLE user ADD INDEX idx_user(user_name , city , age);

什么样的索引可以被使用？

**全匹配：**SELECT * FROM user WHERE user_name=&＃39;JueJin&＃39;AND age=&＃39;5&＃39; AND city=&＃39;上海&＃39;;（与where后查询条件的顺序无关）
匹配最左前缀：(user_name )、(user_name, city)、(user_name , city , age)（满足最左前缀查询条件的顺序与索引列的顺序无关，如：(city, user_name)、(age, city, user_name)）
**匹配列前缀：**SELECT * FROM user WHERE user_name LIKE &＃39;W%&＃39;
**匹配范围值：**SELECT * FROM user WHERE user_name BETWEEN &＃39;W%&＃39; AND &＃39;Z%&＃39;

什么样的索引无法被使用？

**where查询条件中不包含索引列中的最左索引列，则无法使用到索引： **

SELECT * FROM user WHERE city=&＃39;上海&＃39;;

SELECT * FROM user WHERE age=&＃39;26&＃39;;

SELECT * FROM user WHERE age=&＃39;26&＃39; AND city=‘上海&＃39;;

**即使where的查询条件是最左索引列，也无法使用索引查询用户名以N结尾的用户： **

SELECT * FROM user WHERE user_name LIKE &＃39;%N&＃39;;

**如果where查询条件中有某个列的范围查询，其右边的所有列都无法使用索引优化查询： **

SELECT * FROM user WHERE user_name=&＃39;JueJin&＃39; AND city LIKE &＃39;上%&＃39; AND age=31;

**索引列不能是表达式的一部分，也不能作为函数的参数，否则无法使用索引查询： **

SELECT * FROM user WHERE user_name=concat(user_name,&＃39;PLUS&＃39;);

选择合适的索引列顺序

在组合索引的创建中索引列的顺序非常重要，正确的索引顺序依赖于使用该索引的查询的查询方式
对于组合索引的索引顺序可以将选择性最高的列放到索引最前列，该法则与前缀索引的选择性方法一致
并不是说所有的组合索引的顺序都使用该法则就能确定，还需要根据具体的查询场景来确定具体的索引顺序

覆盖索引条件

如果一个索引中包含所有要查询的字段的值，那么就称之为覆盖索引

SELECT user_name, city, age FROM user WHERE user_name=&＃39;Tony&＃39; AND age=&＃39;28&＃39; AND city=&＃39;上海&＃39;;

因为要查询的字段(user_name, city, age)都包含在组合索引的索引列中，所以就使用了覆盖索引查询，查看是否使用了覆盖索引可以通过执行计划中的Extra中的值为Using index则证明使用了覆盖索引，覆盖索引可以极大的提高访问性能。

使用索引进行排序

在排序操作中如果能使用到索引来排序，那么可以极大地提高排序的速度，要使用索引来排序需要满足以下两点即可：

ORDER BY子句后的列顺序要与组合索引的列顺序一致，且所有排序列的排序方向(正序/倒序)需一致
所查询的字段值需要包含在索引列中，及满足覆盖索引

排序可用demo：

SELECT user_name, city, age FROM user_test ORDER BY user_name;
SELECT user_name, city, age FROM user_test ORDER BY user_name,city;
SELECT user_name, city, age FROM user_test ORDER BY user_name DESC,city DESC;
SELECT user_name, city, age FROM user_test WHERE user_name=&＃39;Tony&＃39; ORDER BY city;

排序不可用demo：

SELECT user_name, city, age FROM user_test ORDER BY user_name gender;
SELECT user_name, city, age, gender FROM user_test ORDER BY user_name;
SELECT user_name, city, age FROM user_test ORDER BY user_name ASC,city DESC;
SELECT user_name, city, age FROM user_test WHERE user_name LIKE &＃39;W%&＃39; ORDER BY city;

数据获取建议

不要返回应用户程序所不需要的数据限制返回数

LIMIT：MySQL并不能按照需求返回数据量，也就是MySQL总是会查询出全部数据，使用LIMIT子句其实是为了减小网络数据传输的压力，并不会减小数据的读取行数。

去掉不需要的列

SELECT * 语句取出表中的所有字段，不论该字段的数据对调用的应用程序是否有用，这会对服务器资源造成浪费，甚至会对服务器的性能产生一定的影响
如果表的结构在以后发生了改变，那么 SELECT * 语句可能会取到不正确的数据
执行 SELECT * 语句时，首先要查找出表中有哪些列，然后才能开始执行 SELECT * 语句，这在某些情况会产生性能问题
使用 SELECT * 语句将不会使到覆盖索引，不利于查询的性能优化

正确使用索引的优点

避免全表扫描

单表查询时，全表扫描需要查询每一行
多表查询时，全表扫描至少需要检索所有表中每一行

提高速度

可以迅速定位结果集的第一行
排除不相关的结果
对于MIN()或者MAX()值不必检查每一行

提高排序和分组的效率
在可以使用覆盖索引的情况下避免row loop-up

索引的代价

如果存在过多索引，数据修改将会变得缓慢

受影响的索引需要被更新
对于写密集型环境压力很大

索引消耗过多磁盘空间

InnoDB存储引擎将索引和数据存储在一起
需要监控磁盘空间

索引最佳实践

对于如下列考虑使用索引

WHERE子句中的列
ORDER BY或GROUP BY子句中的列
表连接条件列

考虑针对字符串型列使用前缀索引

可以更快速地比较与loop up
减少磁盘I/O

SELECT语句效率低下时考虑

避免全表扫描
尝试增加索引

WHERE语句
表连接条件

利用ANALYZE TABLE来收集统计信息
考虑存储引擎层的优化

调优表连接方法

在ON或USING子句的列上增加索引
利用SELECT STRAIGHT_JOIN来强制表连接顺序
在ORDER BY和GROUP BY的列上增加索引
join连接不一定比子查询效率高

更多相关免费学习推荐：mysql教程(视频)

以上就是关系数据库之mysql三：从一条sql的生命周期说起的详细内容，更多请关注第一PHP社区其它相关文章！

推荐阅读

select
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
select
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
select
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新 2024-12-28 12:22:34
timezone
PHP 5.2.5 安装与配置指南

本文详细介绍了 PHP 5.2.5 的安装和配置步骤，帮助开发者解决常见的环境配置问题，特别是上传图片时遇到的错误。通过本教程，您可以顺利搭建并优化 PHP 运行环境。 ... [详细]

蜡笔小新 2024-12-27 19:05:41
jsp
网站与MySQL数据库的连接与交互

本文详细介绍了如何通过多种编程语言（如PHP、JSP）实现网站与MySQL数据库的连接，包括创建数据库、表的基本操作，以及数据的读取和写入方法。 ... [详细]

蜡笔小新 2024-12-27 14:09:23
shell
使用Vultr云服务器和Namesilo域名搭建个人网站

本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站，包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南，帮助读者顺利完成建站过程。 ... [详细]

蜡笔小新 2024-12-26 16:36:34
select
SQL数据库管理系统（DBMS）中常见函数的差异与应用

本文详细探讨了不同SQL数据库管理系统（DBMS）在限制输出结果、拼接字段和日期时间处理方面的函数差异。通过具体示例，帮助读者理解并掌握如何在不同DBMS中实现相同功能。 ... [详细]

蜡笔小新 2024-12-28 13:26:49
select
Windows服务与数据库交互问题解析

本文探讨了在Windows 10（64位）环境下开发的Windows服务，旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行，但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-28 10:30:14
select
C++实现经典排序算法

本文详细介绍了七种经典的排序算法及其性能分析。每种算法的平均、最坏和最好情况的时间复杂度、辅助空间需求以及稳定性都被列出，帮助读者全面了解这些排序方法的特点。 ... [详细]

蜡笔小新 2024-12-27 19:25:14
jsp
深入理解Cookie与Session会话管理

本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息，以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制，解释其原理及应用场景。 ... [详细]

蜡笔小新 2024-12-27 18:20:43
jsp
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
rsa
网络攻防实战：从HTTP到HTTPS的演变

本文通过一系列日记记录了从发现漏洞到逐步加强安全措施的过程，探讨了如何应对网络攻击并最终实现全面的安全防护。 ... [详细]

蜡笔小新 2024-12-27 11:34:50
client
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
go
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
select
解决SQL Server动态SQL中LIKE语句参数传递导致无返回值的问题

在使用SQL Server进行动态SQL查询时，如果遇到LIKE语句无法正确返回预期结果的情况，通常是因为参数传递方式不当。本文将详细探讨这一问题，并提供解决方案及相关的技术背景。 ... [详细]

蜡笔小新 2024-12-26 17:02:33

90后的中老年人

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章