当前位置: 开发笔记 > 数据库 > 正文

你了解SQL的索引原理吗

作者：pfm4191006 | 来源：互联网 | 2018-06-10 11:25

上篇文章粗略的总结了些SQL聚集索引与非聚集索引的区别，但看起来好像不太清晰，这篇我通过索引原理来再一次分析下。索引是为检索而存在的，就是说索引并不是一个表必须的。表索引由多个页面组成，这些页面一起组成了一个树形结构，即我们通常说的B树，首先

上篇文章粗略的总结了些SQL聚集索引与非聚集索引的区别，但看起来好像不太清晰，这篇我通过索引原理来再一次分析下。

索引是为检索而存在的，就是说索引并不是一个表必须的。表索引由多个页面组成，这些页面一起组成了一个树形结构，即我们通常说的B树，首先来看下表索引的组成部分：

根极节点，root，它指向另外两个页，把一个表的记录从逻辑上分成非叶级节点Non-Leaf Level(枝)，它指向了更加小的叶级节点Leaf Level(叶)。根节点、非叶级节点和叶级节点都位于索引页中，统称为索引叶节点，属于索引页的范筹。这些"枝"、"叶"最终指向数据页Page。根级节点和叶级节点之间的叶又叫数据中间页。根节点对应了sysindexes表的Root字段，记载了非叶级节点的物理位置（即指针）；非叶级节点位于根节点和叶节点之间，记载了指向叶级节点的指针；而叶级节点则最终指向数据页，这就是最后的B树。

数据库是怎样访问表数据的：

第一：没有创建任何索引的表。

这种表我们称为堆表，因为所有的数据页都是无序的，杂乱无章的，在查询数据时，需要一条一条记录查询，有时第一条记录就能找到，最坏的情况是在最后一条记录中查找到,但是千万不要认为SQL此时查找到数据后会当成结果立即返回，SQL即使查找到了记录，也会将所有数据遍历一次，这能从最终的执行计划中得知，就是平时说的表扫描，对于没有索引的表也能查询，就是效率会特别低，如果数据量稍大的话。

问题：SQL是如何得知表没有索引呢？

SQL在接到查询请求的时候，会分析sysindexes表中索引标志符(INDID: Index ID)的字段的值，如果该值为0，表示这是一张数据表而不是索引表，SQL就会使用sysindexes表的另一个字段FirstIAM值中找到该表的IAM 页链也就是所有数据页集合。至于什么是IAM,大家可以网上搜索下。

第二：访问创建有非聚集索引的表。

非聚集索引可以建多个,形成B树结构，叶级节点不包含数据页，只包含索引行。如果表中只有非聚集索引，则每个索引行包含了非聚集索引键值以及行定位符（ROW ID,RID），他们指向具有该键值的数据行。RID由文件ID、页编号和在页中行的编号组成。当 INDID的值在2-250之间时，说明表中存在非聚集索引页。SQL调用ROOT字段的值指向非聚集索引B树的ROOT，查找与被查询最相近的值，根据这个值找到在非叶级节点中的页号，在叶级节点相应的页面中找到该值的RID，最后根据这个RID在Heap中定位所在的页和行并返回到查询端。

上篇文章的cityid上建立了非聚集索引，执行Select * From student Where cityid='0101'时，查询过程是：

在sysindexes表查询INDID值为2，说明有非聚集索引；
从根出发，在非叶级节点中定位最接近0101的值(枝节点)，查到其位于叶级页面的第n页；
在叶级页面的第n页下搜寻0101的RID，其RID显示为N∶i∶j，表示cityid字段中名为0101的记录位于堆的第i页的第j行，N代表文件的ID值。
在堆的第 i页第j行将该记录返回给客户端。

第三：访问创建有聚集索引的表。

聚集索引中，数据所在的数据页是叶级，索引数据所在的索引页是非叶级。原理和上述非聚集索引的查询差不多，由于记录是按聚集索引键值进行排序，即聚集索引的索引键值也就是具体的数据页。这种情况比起非聚集索引要简单很多,因为比非聚集索引少了一层节点查询。

上篇文章的username字段上建立了聚集索引，此时执行Select* From student Where username='1'时，查询过程是：

在sysindexes表查询INDID值为1，说明表中建立了聚集索；
从根出发，在非叶级节点中定位最接近1的值(枝节点)，再查到其位于叶级页面的第n页；
在叶级页面第n页下搜寻值为1的条目，而这一条目就是数据记录本身；
将该记录返回客户端。

下图可做参考：

第四：怎样访问既有聚集索引、又有非聚集索引的数据表：

username字段上建立了聚集索引，cityid上建立了非聚集索引，当执行Select * From student Where cityid='0101'时，查询过程是：

在sysindexes表查询INDID值为2,说明有非聚集索引；
从根出发，在cityid的非聚集索引的非叶级节点中定位最接近0101的条目；
从上面条目下的叶级页面中查到0101的逻辑位置，是聚集索引的指针；
根据指针所指示位置，进入位于username的聚集索引中的叶级页面中找到0101数据记录；
将该记录返回客户端。

通过上面数据库访问索引的原理，我们就很容易解释聚集索引与非聚集索引的区别了，原理都一样，关键看什么场合应用什么索引了,下一篇我来总结一些不同场合最适合采用什么样的索引，不对之外多多指点。

推荐阅读

数据库
导入大csv文件到mysql（CSV导入）

导入大csv文件到mysql（CSV导入） ... [详细]

蜡笔小新 2024-12-12 15:01:40
mysql
MySQL Binlog 中 DDL 语句对事务的影响分析

当 MySQL 的 autocommit 设置为 1 时，如果在一个事务中执行了 DDL 语句，那么该事务中从开始到执行 DDL 语句之前的所有 DML 操作将自动提交。随后的 DML 操作则需要在新的事务中进行。 ... [详细]

蜡笔小新 2024-12-12 13:43:55
数据库
58同城的Elasticsearch应用与平台构建实践

本文由58同城高级架构师于伯伟分享，由陈树昌编辑整理，内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用，特别是在58同城的实施案例，包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]

蜡笔小新 2024-12-11 19:31:21
数据库
.NET Core中的一个接口多种实现的依赖注入与动态选择看这篇就够了

.NETCore中的一个接口多种实现的依赖注入与动态选择看这篇就够了最近有个需求就是一个抽象仓储层接口方法需要SqlServer以及Oracle两种实现方式，为了灵活我在依赖注入的 ... [详细]

蜡笔小新 2024-12-11 18:50:27
sql
如何使用SQL查询过去7天的数据

请求一段SQL代码，用于从数据库中提取当前日期前7天的数据记录。例如，如果今天是2011年5月9日，则需要获取从2011年5月3日至2011年5月9日之间的所有记录。 ... [详细]

蜡笔小新 2024-12-11 17:26:34
数据库
SQL Server 实例默认排序规则详解

本文详细介绍了如何在安装过程中为 SQL Server 实例指定默认排序规则，并讨论了不同安装选项下的排序规则选择逻辑。 ... [详细]

蜡笔小新 2024-12-11 17:06:51
数据库
使用Solr从MySQL导入数据构建全量索引

为了更好地掌握Solr的各项功能，本文档将在本地Windows环境中演示如何从MySQL数据库中导入数据至Solr，并构建全量索引。这将有助于开发者熟悉Solr的数据处理流程，尤其是在无法直接在生产服务器上进行实践的情况下。 ... [详细]

蜡笔小新 2024-12-11 16:27:23
数据库
MySQL中的Anemometer使用指南

本文详细介绍了如何在MySQL环境中部署和使用Anemometer，以帮助开发者有效监控和优化慢查询性能。通过本文，您将了解从环境准备到具体配置的全过程。 ... [详细]

蜡笔小新 2024-12-11 16:16:39
sql
SPSS应用指南：t检验与卡方检验的简易解析

本文旨在为读者提供SPSS中t检验和卡方检验的简单明了介绍，帮助初学者快速掌握这两种常用统计方法的应用技巧。通过实际案例分析，加深对理论知识的理解。 ... [详细]

蜡笔小新 2024-12-11 15:46:42
数据库
Oracle数据库中的角色管理与测试

本文探讨了Oracle数据库中角色的创建与管理方法，包括如何使用SET ROLE命令激活特定角色，并调整用户的默认角色设置。 ... [详细]

蜡笔小新 2024-12-11 14:17:11
sql
如何在HTML中为两个不同的div设置不同的overflow属性

探讨在Web前端开发中，如何使用CSS的overflow属性来实现两个div的不同滚动效果，特别是当设计一个弹出窗口时的需求处理。 ... [详细]

蜡笔小新 2024-12-11 14:15:36
sql
使用TSimpleMsgPack进行消息打包与解包的示例

本文介绍了如何在Delphi中使用TSimpleMsgPack组件来实现消息的打包和解包功能，包括网络通信中的数据处理。 ... [详细]

蜡笔小新 2024-12-11 13:17:44
sql
Java项目连接Oracle数据库时遇到异常

在尝试通过Java项目连接Oracle数据库时，遇到了一个严重的初始化上下文监听器异常。 ... [详细]

蜡笔小新 2024-12-11 12:55:52
数据库
Python 3.3 与 MySQL 数据库交互指南

本文详细介绍了如何在 Python 3.3 环境下操作 MySQL 数据库，包括调用存储过程、连接数据库以及基本的数据操作方法。 ... [详细]

蜡笔小新 2024-12-11 12:41:21
数据库
MyBatis系列之八：深入理解延迟加载

本文详细介绍了MyBatis中的延迟加载功能，包括其基本概念、实现方式以及如何在实际开发中应用。通过具体的代码示例，帮助读者更好地理解和掌握这一优化数据库查询性能的重要技术。 ... [详细]

蜡笔小新 2024-12-10 22:57:28

pfm4191006

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章