热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

一次mysql慢查询事故分析_MySQL

年前项目组接微信公众号。上线之后,跟微信相关的用cid列的查询会话的SQL变慢了几十倍!思考这个问题思考了很久,从出现以来一直是我心头的一个结。cid这一列是建了索引的,普通的cid列更新都没问题,为何
年前项目组接微信公众号。上线之后,跟微信相关的用cid列的查询会话的SQL变慢了几十倍!思考这个问题思考了很久,从出现以来一直是我心头的一个结。cid这一列是建了索引的,普通的cid列更新都没问题,为何只有微信的有问题?相同的前缀又是如何影响索引的?
分析过程 1.explain下微信cid的查询,微信的cid会以mid-qqwanggou001为前缀插入数据
explain
select *
from analysis_sessions
where cid = "mid-qqwanggou001-b99359d9054171901c0"

分析结果如下:

\

从explain分析可以看出,这个查询使用了索引,但是innodb认为有165万行数据需要给mysql服务器筛选(也就是用where条件过滤)。如果这些庞大的数据在内存,遍历一遍花不了多少时间。但是极有可能,这些数据是在磁盘上的。这么多的数据从磁盘读取然后载入内存,大量磁盘IO必然是十分的耗时的。
2.分析普通cid的查询

取数据进行explain,cid = "sid-a2f9047ddf528d837e5f60843c83aae9"。这个数据是不带公共前缀的。

explain
select *
from analysis_sessions
where cid = "sid-a2f9047ddf528d837e5f60843c83aae9"

分析结果如下:

\

相同的列,相同的索引,这次存储引擎向mysql服务器仅仅返回了一行数据。也就是说innodb仅仅需要读取一个二级索引的叶子节点。相对于上面那个sql的IO,压力显然小很多。
初步分析结论:带有长前缀的cid查询,innodb存储引擎会向mysql上端服务器返回百万级别的数据。这只是现象,我还是想问,相同的表,相同的列,相同的索引结构(B+树索引),相同的查询,仅仅不同的数据,结果为何有差么大的差别?
近一步分析
纠结这个问题很久了,直到前天晚上散步时候,无意的会想到了 explain结果的key_len这一列。这一列我从来不看,觉得没用,但是27与cid这一列50个varchar的定义格格不入。27明显小于50,首先可以肯定,这个索引用的是前缀索引,说白了,截取了字符串的前面一部分作为索引数据。analysis_session表用的gbk编码,也就是说,索引需要2个字节表示一个varchar。解释一下key_len
27 = 2 * 12 + 2 + 1
27位的索引,仅仅索引了前面12个字符。中间的2存储长度,后面的一个字节存储Null信息,因为这一列是允许Null的。
最终结论:问题到这已经很明了了,微信cid的前缀是17个字符的,大于前缀索引的12个字符,也就是说,所有存储微信cid数据(百万级别)B+树叶子节点将只有一个B+树非叶节点的指针指向这里。于是,当你查微信cid相关的数据时,所有微信cid将被返回给mysql服务器进行where过滤了,效率上讲,这是很恐怖的。索引确实还是被用上了,不然会造成全表扫描。但是这个数据设计的有问题,B+树的查找效率是O(LogN)的,但是遇上这个数据,立刻变成O(N),相当于一个局部全表扫描。
那么合理的推测,只要有新增的微信cid,微信cid的查询只会变的更慢!
引申,更佳的代码 practice:
varchar,blob, text等边长数据建索引的时候,数据库会自动建前缀索引,于是B+树不会索引整个字段的部分。很多同学喜欢用前缀作为字符串的标志,这次要注意了,有前车之鉴了。前缀存入mysql之后会降低检索效率,前缀越长,B+树查询的效率越低。
这里给出代码的建议:
1.将前缀作为后缀,startWith改为endWith

2.不要尝试后缀模糊搜索,like "%.com",这种做法更糟糕,完全用不了索引,于是全表扫描。

推荐阅读
  • 从CodeIgniter中提取图像处理组件
    本指南旨在帮助开发者在未使用CodeIgniter框架的情况下,如何独立使用其强大的图像处理功能,包括图像尺寸调整、创建缩略图、裁剪、旋转及添加水印等。 ... [详细]
  • 软件测试行业深度解析:迈向高薪的必经之路
    本文深入探讨了软件测试行业的发展现状及未来趋势,旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]
  • 如何将955万数据表的17秒SQL查询优化至300毫秒
    本文详细介绍了通过优化SQL查询策略,成功将一张包含955万条记录的财务流水表的查询时间从17秒缩短至300毫秒的方法。文章不仅提供了具体的SQL优化技巧,还深入探讨了背后的数据库原理。 ... [详细]
  • CentOS下ProFTPD的安装与配置指南
    本文详细介绍在CentOS操作系统上安装和配置ProFTPD服务的方法,包括基本配置、安全设置及高级功能的启用。 ... [详细]
  • 2023年,Android开发前景如何?25岁还能转行吗?
    近期,关于Android开发行业的讨论在多个平台上热度不减,许多人担忧其未来发展。本文将探讨当前Android开发市场的现状、薪资水平及职业选择建议。 ... [详细]
  • 本文介绍了SIP(Session Initiation Protocol,会话发起协议)的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ... [详细]
  • 二维码的实现与应用
    本文介绍了二维码的基本概念、分类及其优缺点,并详细描述了如何使用Java编程语言结合第三方库(如ZXing和qrcode.jar)来实现二维码的生成与解析。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 华为与红帽联手,加速开源电信软件革新
    华为与红帽携手合作,旨在加速开源电信软件的发展,以满足大型电信运营商对灵活网络解决方案的需求。 ... [详细]
  • 解决JavaScript中法语字符排序问题
    在开发一个使用JavaScript、HTML和CSS的Web应用时,遇到从SQLite数据库中提取的法语词汇排序不正确的问题,特别是带重音符号的字母未按预期排序。 ... [详细]
  • 本文详细介绍了PostgreSQL与MySQL在SQL语法上的主要区别,包括如何使用COALESCE替代IFNULL、金额格式化的方法、别名处理以及日期处理等关键点。 ... [详细]
  • 本文详细介绍了如何搭建一个高可用的MongoDB集群,包括环境准备、用户配置、目录创建、MongoDB安装、配置文件设置、集群组件部署等步骤。特别关注分片、读写分离及负载均衡的实现。 ... [详细]
  • 探讨符合特定需求的个人网盘选择,包括分享功能、WebDAV支持及长期稳定性等。 ... [详细]
  • 在处理大数据量的SQL分页查询时,通常需要执行两次查询来分别获取数据和总记录数。本文介绍了一种优化方法,通过单次查询同时返回分页数据和总记录数,从而提高查询效率。 ... [详细]
  • flea,frame,db,使用,之 ... [详细]
author-avatar
用户uuexwjx90j
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有