热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

详解SQLServer表和索引存储结构

这篇文章主要介绍了详解SQLServer表和索引存储结构,有助于大家对SQL存储方式有深入的理解,参考学习下吧。

本文详细分析了SQL Server中表和索引结构存储的原理以及对于如何加快搜索速度和提高效率等方面做了详细的分析,以下是主要内容。

下图显示了表的存储组织,每张表有一个对应的对象ID,并且包含一个或多个分区,每个分区会有一个堆或者多个B树,堆或者B树的结构是预留的。每个堆或者是B树都有三个分配单元用来存放数据,分别是数据、LOB、行溢出,使用最多的分配单元是数据。如果有LOB数据或者是长度超过8000字节的记录,则可能有另外的LOB分配单元和行溢出分配单元。

小总结: 一个表可以有多个分区,但是每个分区(堆/B树)最多有三个分配单元,每个分配单元可以有很多页,对于每个分配单元内的数据页,根据表是否有索引,以及索引是聚集还是非聚集,组织方式有以下三种:

1. 堆

所谓堆(heap),就是不含聚集索引的表。堆的 sys.partitions 中具有一行,对于堆使用的每个分区,都有 index_id = 0。只有一个分区,在系统表里,对于这个分区下面的每个分配单元都有一个连接指向Index Allocation Map页(IAM),在IAM页里,描述了区的信息。

sys.system_internals_allocation_units 系统视图中的列 first_iam_page 指向管理特定分区中堆的分配空间的一系列 IAM 页的第一页。SQL Server  使用 IAM 页在堆中移动。堆内的数据页和行没有任何特定的顺序,也不链接在一起。数据页之间唯一的逻辑连接是记录在 IAM 页内的信息。

2. 具有非聚集索引的表

如果有一个表只有非聚集索引而没有聚集索引,对应的索引号是2--250。那么针对每个非聚集索引,都有一个对应的分区,在系统表进而,对于这个分区下面的每个分配单元,都有一个连接指向根页。数据页之间通过前后指针互相联系,是一个完整的树形结构。在树的底层,会有一个连接指向真正的数据,连接的形式是文件号+页号+行号,而真正的数据是以堆的形式存放的。如下图所示:

3. 具有聚集索引的表

表中的聚集索引,对应的索引号是1。它有一个对应的分区,该分区下的每个分配单元都有一个连接指向根页。对于聚集索引来说,叶子结点里存放的是真正的数据,而不是非聚集索引那样的连接。如下图所示:

 

非聚集索引与聚集索引具有相同的 B 树结构,它们之间的显著差别在于以下两点:

基础表的数据行不按非聚集键的顺序排序和存储。

非聚集索引的叶层是由索引页而不是由数据页组成

案例分析: 我们来查看一个表的存储结构,我们在此使用的表是一个生产表,共有1亿多条记录,查看表的object_ID,如下图所示:

此表,我已经做了分区,查看其分区信息,可以使用下图所示的命令:

从上图可以看到,此表共有16个分区,对应不同的索引,基本上每个分区都有1千多万条记录。从此图中还可以看到堆或者B树的ID跟分区ID是一样的,如果希望进一步查看某一个索引的具体信息,可以使用下面的命令,如查看72057594067419136的信息。

从这个图当中,我们可以看到这个分区只有一个分配单元,IN_ROW_DATA表明此分配单元只用来存放具体数据,共5353页,已使用5346页,数据占用5320页。

如果希望查看根页的位置,可以使用下面的命令:

 

但需要注意,这里显示的根页的位置是0xEC0100001100,由于存储的关系,用倒序的方式对它进行解析,也就是0x0011000001EC,最前面的两个字节表明是所在的文件组编号,后面的4个字节是页的编号,即(1,0x01CE) ,换成十进制(1,492),然后可以利用我们上一节所说的DBCC PAGE命令查看页的信息,如下图所示:

从中可以看到具体的数据,此界面的返回结果会因表上的聚集索引、非聚集索引而不同。如果查看一个表使用的总页数和区数,也可以使用命令:DBCC SHOWCONFIG,如下图所示:

在同样表结构的情况下,建立聚集索引不会增加表格的大小,但是建立非聚集索引反而会增加不少空间,在性能方面,SQL Server产品组做过测试,在select、update、delete操作下,聚集索引性能较高,在插入记录时,聚集索引和非聚集索引性能相同,没有出现聚集索引影响插入速度的现象,但在生产环境中,还是要谨慎行事。


推荐阅读
  • 在使用 DataGridView 时,如果在当前单元格中输入内容但光标未移开,点击保存按钮后,输入的内容可能无法保存。只有当光标离开单元格后,才能成功保存数据。本文将探讨如何通过调用 DataGridView 的内置方法解决此问题。 ... [详细]
  • 本文详细介绍了如何在 Linux 平台上安装和配置 PostgreSQL 数据库。通过访问官方资源并遵循特定的操作步骤,用户可以在不同发行版(如 Ubuntu 和 Red Hat)上顺利完成 PostgreSQL 的安装。 ... [详细]
  • 精选30本C# ASP.NET SQL中文PDF电子书合集
    欢迎订阅我们的技术博客,获取更多关于C#、ASP.NET和SQL的最新资讯和资源。 ... [详细]
  • MySQL 数据库迁移指南:从本地到远程及磁盘间迁移
    本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移,包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机,以及解决迁移过程中可能遇到的问题。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文介绍如何在 FireDAC 环境下实现 FDMEMTable 字段的自动获取,为开发人员提供便捷的数据处理方式。 ... [详细]
  • 本文由瀚高PG实验室撰写,详细介绍了如何在PostgreSQL中创建、管理和删除模式。文章涵盖了创建模式的基本命令、public模式的特性、权限设置以及通过角色对象简化操作的方法。 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • openGauss每日一练:第6天 - 模式的创建、修改与删除
    本篇笔记记录了openGauss数据库中关于模式(Schema)的创建、修改和删除操作。通过这些操作,用户可以更好地管理和控制数据库对象。实验环境为openGauss 2.0.0,并使用由墨天轮提供的线上环境。 ... [详细]
  • 本文详细介绍了 MySQL 中 LAST_INSERT_ID() 函数的使用方法及其工作原理,包括如何获取最后一个插入记录的自增 ID、多行插入时的行为以及在不同客户端环境下的表现。 ... [详细]
  • 深入解析三大范式与JDBC集成
    本文详细探讨了数据库设计中的三大范式,并结合Java数据库连接(JDBC)技术,讲解如何在实际开发中应用这些概念。通过实例和图表,帮助读者更好地理解范式理论及其在数据操作中的重要性。 ... [详细]
  • 本文详细探讨了JDBC(Java数据库连接)的内部机制,重点分析其作为服务提供者接口(SPI)框架的应用。通过类图和代码示例,展示了JDBC如何注册驱动程序、建立数据库连接以及执行SQL查询的过程。 ... [详细]
  • MySQL索引详解与优化
    本文深入探讨了MySQL中的索引机制,包括索引的基本概念、优势与劣势、分类及其实现原理,并详细介绍了索引的使用场景和优化技巧。通过具体示例,帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]
  • 本文探讨了领域驱动设计(DDD)的核心概念、应用场景及其实现方式,详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型,展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]
  • 本文探讨了MariaDB在当前数据库市场中的地位和挑战,分析其可能面临的困境,并提出了对未来发展的几点看法。 ... [详细]
author-avatar
手机用户2502895461
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有