一次mysql慢查询事故分析_MySQL

作者：用户uuexwjx90j | 来源：互联网 | 2017-05-12 16:11

年前项目组接微信公众号。上线之后，跟微信相关的用cid列的查询会话的SQL变慢了几十倍！思考这个问题思考了很久，从出现以来一直是我心头的一个结。cid这一列是建了索引的，普通的cid列更新都没问题，为何

年前项目组接微信公众号。上线之后，跟微信相关的用cid列的查询会话的SQL变慢了几十倍！思考这个问题思考了很久，从出现以来一直是我心头的一个结。cid这一列是建了索引的，普通的cid列更新都没问题，为何只有微信的有问题？相同的前缀又是如何影响索引的？
分析过程 1.explain下微信cid的查询，微信的cid会以mid-qqwanggou001为前缀插入数据

explain
select *

from analysis_sessions

where cid = "mid-qqwanggou001-b99359d9054171901c0"

分析结果如下：

从explain分析可以看出，这个查询使用了索引，但是innodb认为有165万行数据需要给mysql服务器筛选（也就是用where条件过滤）。如果这些庞大的数据在内存，遍历一遍花不了多少时间。但是极有可能，这些数据是在磁盘上的。这么多的数据从磁盘读取然后载入内存，大量磁盘IO必然是十分的耗时的。

2.分析普通cid的查询

取数据进行explain，cid = "sid-a2f9047ddf528d837e5f60843c83aae9"。这个数据是不带公共前缀的。

explain

select *

from analysis_sessions

where cid = "sid-a2f9047ddf528d837e5f60843c83aae9"

分析结果如下：

相同的列，相同的索引，这次存储引擎向mysql服务器仅仅返回了一行数据。也就是说innodb仅仅需要读取一个二级索引的叶子节点。相对于上面那个sql的IO，压力显然小很多。

初步分析结论：带有长前缀的cid查询，innodb存储引擎会向mysql上端服务器返回百万级别的数据。这只是现象，我还是想问，相同的表，相同的列，相同的索引结构（B+树索引），相同的查询，仅仅不同的数据，结果为何有差么大的差别？

近一步分析

纠结这个问题很久了，直到前天晚上散步时候，无意的会想到了 explain结果的key_len这一列。这一列我从来不看，觉得没用，但是27与cid这一列50个varchar的定义格格不入。27明显小于50，首先可以肯定，这个索引用的是前缀索引，说白了，截取了字符串的前面一部分作为索引数据。analysis_session表用的gbk编码，也就是说，索引需要2个字节表示一个varchar。解释一下key_len

27 = 2 * 12 + 2 + 1

27位的索引，仅仅索引了前面12个字符。中间的2存储长度，后面的一个字节存储Null信息，因为这一列是允许Null的。

最终结论：问题到这已经很明了了，微信cid的前缀是17个字符的，大于前缀索引的12个字符，也就是说，所有存储微信cid数据（百万级别）B+树叶子节点将只有一个B+树非叶节点的指针指向这里。于是，当你查微信cid相关的数据时，所有微信cid将被返回给mysql服务器进行where过滤了，效率上讲，这是很恐怖的。索引确实还是被用上了，不然会造成全表扫描。但是这个数据设计的有问题，B+树的查找效率是O(LogN)的，但是遇上这个数据，立刻变成O(N),相当于一个局部全表扫描。

那么合理的推测，只要有新增的微信cid，微信cid的查询只会变的更慢！

引申，更佳的代码 practice：

varchar，blob, text等边长数据建索引的时候，数据库会自动建前缀索引，于是B+树不会索引整个字段的部分。很多同学喜欢用前缀作为字符串的标志，这次要注意了，有前车之鉴了。前缀存入mysql之后会降低检索效率，前缀越长，B+树查询的效率越低。

这里给出代码的建议：

1.将前缀作为后缀，startWith改为endWith

2.不要尝试后缀模糊搜索，like "%.com",这种做法更糟糕，完全用不了索引，于是全表扫描。

推荐阅读

go
MySQL缓存机制深度解析

本文详细探讨了MySQL的缓存机制，包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术，读者可以更好地优化数据库性能。 ... [详细]

蜡笔小新 2024-12-26 15:15:06
object
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
php
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
go
数据管理权威指南：《DAMA-DMBOK2 数据管理知识体系》

本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释，构建了数据管理的总体框架，为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]

蜡笔小新 2024-12-27 18:29:55
go
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
get
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
go
开源软件：新时代的商业机遇与挑战

在哈佛大学商学院举行的Cyberposium大会上，专家们深入探讨了开源软件的崛起及其对企业市场的影响。会议指出，开源软件不仅为企业提供了新的增长机会，还促进了软件质量的提升和创新。 ... [详细]

蜡笔小新 2024-12-27 14:49:56
go
探索适用于Spring Boot的Web版SQL管理工具

本文探讨了适用于Spring Boot应用程序的Web版SQL管理工具，这些工具不仅支持H2数据库，还能够处理MySQL和Oracle等主流数据库的表结构修改。 ... [详细]

蜡笔小新 2024-12-27 14:21:10
php
网站与MySQL数据库的连接与交互

本文详细介绍了如何通过多种编程语言（如PHP、JSP）实现网站与MySQL数据库的连接，包括创建数据库、表的基本操作，以及数据的读取和写入方法。 ... [详细]

蜡笔小新 2024-12-27 14:09:23
go
深入解析：手把手教你构建决策树算法

本文详细介绍了机器学习中广泛应用的决策树算法，通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字，建议阅读时间5分钟。 ... [详细]

蜡笔小新 2024-12-27 13:44:59
go
MyBatis：深入解析与应用

在当前众多持久层框架中，MyBatis（前身为iBatis）凭借其轻量级、易用性和对SQL的直接支持，成为许多开发者的首选。本文将详细探讨MyBatis的核心概念、设计理念及其优势。 ... [详细]

蜡笔小新 2024-12-27 12:17:16
range
解读MySQL查询执行计划的详细指南

本文旨在帮助开发者和数据库管理员深入了解如何解读MySQL查询执行计划。通过详细的解析，您将掌握优化查询性能的关键技巧，了解各种访问类型和额外信息的含义。 ... [详细]

蜡笔小新 2024-12-26 20:10:30
go
Google Clips智能相机悄然上市：自动捕捉生活中的珍贵瞬间

Google最新推出的嵌入AI技术的便携式相机Clips现已上架，旨在通过人工智能技术自动捕捉用户生活中值得纪念的时刻，帮助人们减少照片数量过多的问题。 ... [详细]

蜡笔小新 2024-12-26 17:26:09
php
PHP 实现微信素材上传

本文介绍了如何使用PHP代码实现微信平台的媒体素材上传功能，详细解释了API接口的使用方法和注意事项，确保文件路径正确以避免常见的错误。 ... [详细]

蜡笔小新 2024-12-26 16:54:06
range
SQL 触发器实现视图插入操作

本文介绍如何通过创建替代插入触发器，使对视图的插入操作能够正确更新相关的基本表。涉及的表包括：飞机（Aircraft）、员工（Employee）和认证（Certification）。 ... [详细]

蜡笔小新 2024-12-26 15:53:40

用户uuexwjx90j

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章