热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

sql不等于优化_不懂SQL优化?那你就OUT了索引(2)

上一遍文章我们主要介绍了什么是索引,为什么要使用索引,索引的好处和如何创建索引,这一篇我们将讨论一下应该如何合理的创建索引。增加索引有如此
53d8569689178b8ff5f8dd218733852c.png

上一遍文章我们主要介绍了什么是索引,为什么要使用索引,索引的好处和如何创建索引,这一篇我们将讨论一下应该如何合理的创建索引。

增加索引有如此多的优点,为什么不对表中的每一个列创建一个索引呢?这种想法固然有其合理性,然而也有其片面性。

虽然,索引有许多优点, 但是,为表中的每一个列都增加索引,是非常不明智的。

这是因为,增加索引也有许多不利的方面。

索引有哪些“副作用”?

1. 创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。 2. 索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,3. 当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。

应该在这些列上创建索引

1.在经常需要搜索的列上,可以加快搜索的速度; 2.在作为主键的列上.3.在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度; 4.在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的; 5.在经常需要order by,group by,distinct 列上创建索引,这样查询可以利用索引的排序,加快排序查询时间; 6.在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。

不应该创建索引的列具有下列特点

1.对于那些在查询中很少使用的列不应该创建索引。原因:既然这些列很少使用到,因此有索引或无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。 2. 对于那些只有很少数据值的列也不应该增加索引原因:由于这些列的取值很少, 例如:学生表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。 3.对于那些定义为text, blob数据类型的列不应该增加索引。原因:这些列的数据量要么相当大,要么取值很少。 4.当修改性能远远大于检索性能时,不应该创建索引。原因:修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索性能。因此当修改性能远远大于检索性能时不应该创建索引。5.单表数据太少,不适合建索引

案列(代码)

示例代码:(无索引的表)

CREATE TABLE t_customer_one(customerId INT PRIMARY KEY AUTO_INCREMENT, -- 编号customerName VARCHAR(20), -- 姓名customerAge INT, -- 年龄customerGender CHAR(3), -- 性别customerPhone VARCHAR(29), -- 联系方式customerEmail VARCHAR(30), -- 电子邮件province VARCHAR(20), -- 所在省份city VARCHAR(30), -- 所在城市address VARCHAR(200) -- 详细地址
);

添加的数据:

共 16777216 条数据

INSERT INTO t_customer_one(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) VALUES('张三',18,'女','15767678798','123456789@qq.com','四川','成都','武侯区科华北路88号');
INSERT INTO t_customer_one(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) VALUES('李四',24,'男','18767689798','234567778@qq.com','广东','广州','白云区天明路188号');
INSERT INTO t_customer_one(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) VALUES('王五',23,'女','17167675698','3456789@qq.com' , '四川','成都','武侯区科华北路85号');
INSERT INTO t_customer_one(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) VALUES('赵六',26,'男','13767659697','45678123@qq.com', '广东','广州','白云区天明路180号');INSERT INTO t_customer_one(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) SELECT customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address FROM t_customer_one;

添加数据需要时间: 大约 8 分钟左右

示例代码:(带索引的表)

CREATE TABLE t_customer_two(customerId INT PRIMARY KEY AUTO_INCREMENT, -- 编号customerName VARCHAR(20), -- 姓名customerAge INT, -- 年龄customerGender CHAR(3), -- 性别customerPhone VARCHAR(29), -- 联系方式customerEmail VARCHAR(30), -- 电子邮件province VARCHAR(20), -- 所在省份city VARCHAR(30), -- 所在城市address VARCHAR(200) -- 详细地址
)

为表2添加索引

-- 单列索引ALTER TABLE t_customer_two ADD INDEX idx_name(customerName);ALTER TABLE t_customer_two ADD INDEX idx_age (customerAge);ALTER TABLE t_customer_two ADD INDEX idx_phone(customerPhone);-- 多列索引(联合索引)CREATE INDEX idx_province_city_address ON t_customer_two(province,city,address);

添加数据(从表1复制数据):

INSERT INTO t_customer_two(customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address) SELECT customerName,customerAge,customerGender,customerPhone,customerEmail,province,city,address FROM t_customer_one;

添加数据需要时间:大约 18分钟

8ff270e83b78527efcc8d548b351a3d0.png

测试

单列索引

案例

* 查询年龄在18岁—23岁的客户的总人数

无索引:

21dda4f2846cbe788f55e8ced1d3cabc.png

查询所用时间:19.75 秒

查看之执行计划: type=all 进行全表扫描

有索引:

0e5ef3322562a50ce33da55e248f5594.png

查询所用时间:5.42 秒

查看之执行计划: type=range,并使用了索引idx_age.

说明:应该在在经常需要根据范围进行搜索的列上创建索引

多列索引

如果有一个页面中有一个搜索部分 会根据输入的 省份,城市,详细地址来搜索客户的详细记录

那么这个时候到底给那一个列加索引比较好?

此时就可以使用多列索引

如果使用多列索引,where条件中字段的顺序非常重要,需要满足最左前缀列

最左前缀&#xff1a; 查询条件中的所有字段需要从最左边列起按顺序出现在多列索引中,查询条件的字段数要 小于,等于多列索引的字段数,中间字段不能存在范围查询的字段 (如<,like等),这样的sql语句可以使用该多列索引。

什么意思&#xff1f;

例如&#xff1a;

select * from t_customer_two Where province&#61;‘xxx’ and city&#61;‘xxxxx’ and address&#61;‘XXX’ -- &#xff08;多列索引有效&#xff09;
select * from t_customer_two Where province&#61;‘xxx’ and city&#61;‘XXX’ -- &#xff08;多列索引有效&#xff09;
select * from t_customer_two Where province&#61;‘xxx’ -- &#xff08;多列索引有效&#xff09;
select * from t_customer_two Where city&#61;‘xxxxx’ and address&#61;‘XXX’ -- &#xff08;多列索引无效&#xff0c;无最左边的province列&#xff09;
select * from t_customer_two Where and address&#61;‘XXX’ -- &#xff08;多列索引无效&#xff09;

使用了索引:

a02176d88a13ff72136ea90d651fbed9.png

未使用索引:

c5b2fe376d75118b0989ee9d39bd5ec9.png

mysql多列索引适合的场景

1. 匹配全值,对索引中的所有列都指定具体的值&#xff08;例如&#xff1a; province&#61;‘xxx’ and city&#61;‘xxx’ and address&#61;‘xxx’&#xff09; 2. 匹配最左前缀&#xff08;例如&#xff1a; province&#61;‘xxx’, 使用索引中的第一列&#xff09; 3. 匹配部分最左前缀&#xff08;例如&#xff1a; province&#61;‘xxx’ and city&#61;‘xxx’&#xff09; 4. 匹配第一列范围查询(可用like a%,但不能使用 like %b 或则 like %b%)

在以下几种情况下,mysql在查询中即使有索引也不会去使用

1. 在多列索引&#xff0c;查询条件中用的不是最左边的列&#xff0c;那么此时是不会使用索引。

c5b2fe376d75118b0989ee9d39bd5ec9.png

2. like查询时 % 出现在第一位也不会使用索引。

195dba6e9fec277b7ff439dfafc000ea.png

3. 条件中有 or 也不会使用索引。

e104bf1c165a931e11b37aa7f538570c.png

4. 如果 mysql 估计使用全表扫描比使用索引快&#xff0c;它也不会使用索引。

原文转自朗沃易课堂&#xff0c;更多精彩内容可以搜索“朗沃”关注公众号&#xff0c;后期更多精彩内容等着你。



推荐阅读
author-avatar
mmmmmmmmmm0000
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有