热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

sqlint转换为varchar_袋鼠云技术荟|SQL优化案例(1):隐式转换

作者:霜华袋鼠云数据库工程师多年数据库运维经验,熟悉阿里云各数据库产品,擅长SQL调优和故障恢复;参与互联网金融、医疗等多个

作者:霜 华

袋鼠云数据库工程师

多年数据库运维经验,熟悉阿里云各数据库产品,擅长SQL调优和故障恢复;参与互联网金融、医疗等多个行业场景架构设计和实施;主导数据库容灾备份架构方案设计与程序实现。

MySQL是当下最流行的关系型数据库之一,互联网高速发展的今天,MySQL数据库在电商、金融等诸多行业的生产系统中被广泛使用。

在实际的开发运维过程中,想必大家也常常会碰到慢SQL的困扰。一条性能不好的SQL,往往会带来过大的性能开销,进而引起整个操作系统资源的过度使用,甚至造成会话堆积,引发线上故障。

而在SQL调优的场景中,一类比较常见的问题,就是隐式类型转换。那什么是隐式转换呢?

在MySQL中,当操作符与不同类型的操作数一起使用时,会发生类型转换以使操作数兼容,此时则会发生隐式转换。出现隐式转换,往往意味着SQL的执行效率将大幅降低。

接下来笔者将结合几大常见场景,让大家实际体会什么是隐式转换,以及如何去应对出现隐式转换的情况,请阅读以下案例。

传递数据类型和字段类型不一致造成隐式转换

一类比较经典的场景就是传递数据类型和字段类型不一致造成的隐式转换,这种场景也是我们平时最常遇到的。具体可以看下下面这个例子:

1) 待优化场景

SQL及执行计划如下:

select * from dt_t1 where emp_no = 41680;

9f9ba4647a1870bdbce4b5bfdcd73b3d.png

该表索引如下:

key idx_empno (`emp_no`)

2)场景解析

从执行计划中Type部分:ALL,全表扫描,而没有走idx_empno索引, 一般这种情况可能传递的数据类型和实际的字段类型不一致,那么我们来看下具体的表结构。

root@localhost mysql.sock 5.7.28-log :[employees] 14:48:10>desc employees;

+------------+---------------+------+-----+---------+-------+

| Field | Type | Null | Key | Default | Extra |

+------------+---------------+------+-----+---------+-------+

| emp_no | varchar(14) | NO | MUL | NULL | |

| birth_date | date | NO | | NULL | |

| first_name | varchar(14) | NO | | NULL | |

| last_name | varchar(16) | NO | | NULL | |

| gender | enum('M','F') | NO | | NULL | |

| hire_date | date | NO | | NULL | |

+------------+---------------+------+-----+---------+-------+

6 rows in set (0.00 sec)

表结构中看到该字段类型为varchar 类型,传递字段为整型,造成隐式转换不能走索引。

3)场景优化

该SQL可通过简单改写来避免出现隐式转换,如下:

select * from dt_t1 where emp_no='41680';

当传入数据是与匹配字段一致的varchar类型时,便可以正常使用到索引了,优化效果如下:

5a803da7b4fd74bf15195200d541fccd.png

​​

关联字段类型不一致造成隐式转换

除了常量匹配的查询场景,关联查询在关联字段不一致的情况下,也会出现隐式转换。

1) 待优化场景

SELECT count(*) from t1 as a

JOIN `t2` b on a.`id` = b.`alipay_order_no` ;

2)场景解析

从执行计划中可以看出被驱动表 b, Extra:Range checked for each record (index map: 0x8)

一般在当我们看到Range checked for each record (index map: 0x8) 的时候,可能就是发生了隐式转换,我们来看下官方文档是怎么解释的

Range checked for each record (index map: N) (JSON property: message)

MySQL found no good index to use, but found that some of indexes might be used after column values from preceding tables are known. For each row combination in the preceding tables, MySQL checks whether it is possible to use a range or index_merge access method to retrieve rows. This is not very fast, but is faster than performing a join with no index at all. The applicability criteria are as described in Section 8.2.1.2, “Range Optimization”, and Section 8.2.1.3, “Index Merge Optimization”, with the exception that all column values for the preceding table are known and considered to be constants.

Indexes are numbered beginning with 1, in the same order as shown by SHOW INDEX for the table. The index map value N is a bitmask value that indicates which indexes are candidates. For example, a value of 0x19 (binary 11001) means that indexes 1, 4, and 5 will be considered.

查看下表结构:

CREATE TABLE `t2` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`alipay_order_no` varchar(45) DEFAULT NULL,

xxxx

PRIMARY KEY (`id`),

KEY `idx_alipay_order_no_temp` (`alipay_order_no`) USING BTREE

) ENGINE=InnoDB AUTO_INCREMENT=2539968 DEFAULT CHARSET=utf8

共返回 1 行记录,花费 5 ms.

CREATE TABLE `t1` (

`id` bigint(20) NOT NULL,

xxxxxx

PRIMARY KEY (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8

共返回 1 行记录,花费 5 ms.

我们从表结构上面进行观察到该关联字段数据 一个是int 类型,一个是varchar 类型。

当发生这种场景的时候我们应该如何优化呢?

我们还回来看看下具体的执行计划,该驱动表为a,被驱动表b; 关联条件:a.id = b.alipay_order_no ; 当a 表的字段id 当为常数传递给b.alipay_order_no 的时候,发生column_type 不一致,无法使用索引,那么我们让a.id 传递的 字段类型和b.alipay_order_no 保持一致,就可以使用索引了?

3)场景优化

我们可以对驱动表的关联字段进行显式的类型转换,让其与被驱动表关联字段类型一致。改写后SQL如下:

SELECT count(*)

from `t1`a

JOIN `t2` b on CAST( a.`id` AS CHAR ) = b.`alipay_order_no`

进行改写后就可以正常利用索引进行关联了,执行计划如下:

425237ca6dfe56996871e012541e42f0.png

​​

字符集不一致造成隐式转换

前面的两种场景都是操作符两侧数据类型不同的情况,事实上,数据类型相同也可能会出现隐式转换,比如下面这个字符集不一致导致隐式转换的例子:

1) 待优化场景

SQL及执行计划如下:

SELECT COUNT(*)

FROM `t1` o

join `t2` og ON `o`.`def8`= `og`.`group_id`

WHERE o.`def1`= 'DG21424956'

dc1c05c5c6b81087a054a43bf1f51ead.png

​​

2)场景解析

从这个执行计划中我们可以看出第二列表og 中含有using join buffer (Block Nested Loop) ,TYpe=ALL .

一般这种情况下:using join buffer (Block Nested Loop) ,发生的情况是 a. 关联字段没有索引 b.发生隐式转换 等

看下具体表结构:

create table t1(

.....

`group_id` varchar(20) NOT NULL,

PRIMARY KEY (`id`),

KEY `group_id` (`group_id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8

create table t2(

.....

`def8` varchar(20) DEFAULT NULL,

PRIMARY KEY (`id`),

KEY `idx_tr_def1` (`def8`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4

我们从表结构中可以看出关联字段都存在索引,但字符集是不一样的,t1 utf8,t2 utf8mb4.

3)场景优化

SQL改写思路和上例类似,我们对驱动表的关联字段进行字符集转换,如下:

SELECT COUNT(*) FROM `t1` o

left join `t2` og ON CONVERT( o.`def8` USING utf8 ) = `og`.`group_id`

WHERE o.`def1`= 'DG21424956

转换成一致的字符集之后,便可以通过索引进行关联了

45c45cbcdf748ef80b3b551e5d6ef7cb.png

校验规则不一致造成隐式转换

那么,只要保证操作符两侧数据类型以及字符集一致,就不会出现隐式转换吗?

答案是否定的,因为字符集还有一个很重要的属性,就是校验规则,当校验规则不一致的时候,也是会出现隐式转换行为的。具体看下面这个例子:

1) 待优化场景

SELECT *

FROM `t1`

WHERE `uuid` in (SELECT uuid FROM t2 WHERE project_create_at!= "0000-00-00 00:00:00")

该SQL执行计划如下:

c82582d717f4230db9dd25da4c95f654.png

​​

2)场景解析

两张表的表结构如下:

CREATE TABLE `t1` (

`id` int(11) NOT NULL AUTO_INCREMENT, `

uuid` varchar(128) COLLATE utf8_unicode_ci NOT NULL DEFAULT '' COMMENT 'UUID',

xxxxxx

PRIMARY KEY (`id`),

UNIQUE KEY `uuid_idx` (`uuid`)

) ENGINE=InnoDB AUTO_INCREMENT=2343994 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci

CREATE TABLE `t2` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`uuid` varchar(128) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL DEFAULT '' COMMENT '项目uuid',

PRIMARY KEY (`id`),

) ENGINE=InnoDB AUTO_INCREMENT=5408 DEFAULT CHARSET=utf8

我们从表结构看出,两张表的关联字段都是存在索引的,并且数据类型以及字符集也都是一致的,但是校验规则的不同导致了这个场景无法使用到索引。

3)场景优化

我们可以通过如下改写,对驱动表关联字段的校验规则进行显示定义,让其与被驱动表一致

explain extended

select b.*

from (select uuid COLLATE utf8_unicode_ci as uuid

from t1 where project_create_at != "0000-00-00 00:00:00") a, t2 b

where a.uuid = b.uuid

+--------------+-----------------------+--------------------+----------------+-----------------------+-------------------+---------------+----------------+-----------------------+

| id | select_type | table | type | key | key_len | ref | rows | Extra |

+--------------+-----------------------+--------------------+----------------+-----------------------+-------------------+---------------+----------------+-----------------------+

| 1 | PRIMARY | | ALL | | | | 51 | |

| 1 | PRIMARY | b | eq_ref | uuid_idx | 386 | a.uuid | 1 | |

| 2 | DERIVED | volunteer_patients | range | idx-project-create-at | 6 | | 51 | Using index condition |

+--------------+-----------------------+--------------------+----------------+-----------------------+-------------------+---------------+----------------+-----------------------+

共返回 3 行记录,花费 4 ms.

可以看到,改写后的SQL,正常使用到索引进行字段关联,这样就达到了我们预期的效果。

总结

隐式转换出现的场景主要有字段类型不一致、关联字段类型不一致、字符集类型不一致或校对规则不一致等。当出现隐式转换带来的SQL性能问题时,分析相应场景对症下药即可。

除此之外,隐式转换还可能会带来查询结果集不准,字符集不一致也会造成主从同步报错等,因此在实际使用时我们应当尽量避免。



推荐阅读
  • MySQL多表数据库操作方法及子查询详解
    本文详细介绍了MySQL数据库的多表操作方法,包括增删改和单表查询,同时还解释了子查询的概念和用法。文章通过示例和步骤说明了如何进行数据的插入、删除和更新操作,以及如何执行单表查询和使用聚合函数进行统计。对于需要对MySQL数据库进行操作的读者来说,本文是一个非常实用的参考资料。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了Redis的基础数据结构string的应用场景,并以面试的形式进行问答讲解,帮助读者更好地理解和应用Redis。同时,描述了一位面试者的心理状态和面试官的行为。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • Explain如何助力SQL语句的优化及其分析方法
    本文介绍了Explain如何助力SQL语句的优化以及分析方法。Explain是一个数据库SQL语句的模拟器,通过对SQL语句的模拟返回一个性能分析表,从而帮助工程师了解程序运行缓慢的原因。文章还介绍了Explain运行方法以及如何分析Explain表格中各个字段的含义。MySQL 5.5开始支持Explain功能,但仅限于select语句,而MySQL 5.7逐渐支持对update、delete和insert语句的模拟和分析。 ... [详细]
  • 超级简单加解密工具的方案和功能
    本文介绍了一个超级简单的加解密工具的方案和功能。该工具可以读取文件头,并根据特定长度进行加密,加密后将加密部分写入源文件。同时,该工具也支持解密操作。加密和解密过程是可逆的。本文还提到了一些相关的功能和使用方法,并给出了Python代码示例。 ... [详细]
  • 电话号码的字母组合解题思路和代码示例
    本文介绍了力扣题目《电话号码的字母组合》的解题思路和代码示例。通过使用哈希表和递归求解的方法,可以将给定的电话号码转换为对应的字母组合。详细的解题思路和代码示例可以帮助读者更好地理解和实现该题目。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • 如何在php中将mysql查询结果赋值给变量
    本文介绍了在php中将mysql查询结果赋值给变量的方法,包括从mysql表中查询count(学号)并赋值给一个变量,以及如何将sql中查询单条结果赋值给php页面的一个变量。同时还讨论了php调用mysql查询结果到变量的方法,并提供了示例代码。 ... [详细]
  • 本文讨论了如何使用IF函数从基于有限输入列表的有限输出列表中获取输出,并提出了是否有更快/更有效的执行代码的方法。作者希望了解是否有办法缩短代码,并从自我开发的角度来看是否有更好的方法。提供的代码可以按原样工作,但作者想知道是否有更好的方法来执行这样的任务。 ... [详细]
  • 本文介绍了Python爬虫技术基础篇面向对象高级编程(中)中的多重继承概念。通过继承,子类可以扩展父类的功能。文章以动物类层次的设计为例,讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例,以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]
  • Day2列表、字典、集合操作详解
    本文详细介绍了列表、字典、集合的操作方法,包括定义列表、访问列表元素、字符串操作、字典操作、集合操作、文件操作、字符编码与转码等内容。内容详实,适合初学者参考。 ... [详细]
  • 基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本
    文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]
  • 软件测试工程师,需要达到什么水平才能顺利拿到 20k+ 无压力?
    前言最近看到很多应届生晒offer,稍有名气点的公司给出的价格都是一年30多W或者月薪20几k,相比之下工作几年的自己薪资确实很寒酸.根据我自己找工作经历,二线城市一般小公司招聘 ... [详细]
author-avatar
波波微博1987_704
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有