当前位置: 开发笔记 > 数据库 > 正文

Sqlserver：索引碎片的查询

作者：留香1980 | 来源：互联网 | 2018-06-02 17:17

索引碎片：内部碎片（或说叶级填充率）：反映数据叶级的空间占用率或空闲率外部碎片：由于sqlserver以连续的8个page作为一个数据库块（区）extent作为读取单位，故此由于物理存储上的区和逻辑上不一致（不连续）而造成io读取切换区碎片：这是堆的

索引碎片：

内部碎片（或说叶级填充率）：反映数据叶级的空间占用率或空闲率
外部碎片：由于sqlserver以连续的8个page作为一个数据库块（区）extent作为读取单位，故此由于物理存储上的区和逻辑上不一致（不连续）而造成io读取切换

区碎片：这是堆的叶级页中出错区所占的百分比。出错区是指：包含堆的当前页的区不是物理上的包含前一页的区后的下一个区。（微软真不会解释概念:(

查询碎片情况：

　　dbcc showcontig：四部分对象名，【索引名】|【索引id】
　　dbcc showcontig：当前库对象id，【索引名】|【索引id】　　　　
　　sys.dm_db_index_physical_stats：数据库id，对象id，索引id，分区id，扫描模式

- - 五个参数，基本上，【0（特殊的，index可以为0，故该处为-1）】|【null】|【default】意义是一样的

基本指标：

扫描密度（%）[最佳计数:实际计数]：这是“最佳计数”与“实际计数”的比率。如果所有内容都是连续的，则该&＃20540;为 100；如果该&＃20540;小于 100，则存在一些碎片。“最佳计数”是指在一切都连续链接的情况下，区更改的理想数目。“实际计数”是指区更改的实际次数。
区扫描碎片（%）：扫描索引的叶级页时出错区所占的百分比。此数与堆无关。对于出错区，包含当前索引页的区在物理上不是包含上一个索引页的区的下一个区。注意：如果索引跨越多个文件，则此数字无意义。
avg_page_space_used_in_percent：平均page空间使用率。相关的概念：页拆分、页填充率
avg_fragment_size_in_pages：平均多少个page就有一个碎片，该&＃20540; 越大越好
avg_fragmentation_in_percent：碎片率，不解释。该&＃20540;越小越好，和avg_fragment_size_in_pages 反比！
page_count：扫描的总page数
record_count：扫描的总记录数。注意：是相对于当前的扫描来说的记录数，不一定是你所认为的用户表的一行数据
forwarded_record_count：页拆分的记录数目

扫描方式

　　索引、堆，因其本质为B数结构，B数是分层级的，故可以多种选择来扫描：非页级？or 仅取一代的样本？or 完全的扫描？

函数的执行模式将确定为了获取此函数所使用的统计信息数据而执行的扫描级别。mode 被指定为 LIMITED、SAMPLED 或 DETAILED。该函数遍历分配单元的页链，这些分配单元构成表或索引的指定分区。sys.dm_db_index_physical_stats 只需要一个意向共享 (IS) 表锁，而忽略其运行所处的模式。有关锁定的详细信息，请参阅锁模式。

LIMITED 模式运行最快，扫描的页数最少。对于索引，只扫描 B 树的父级别页（即叶级别以上的页）。对于堆，只检查关联的 PFS 和 IAM 页；不扫描堆的数据页。在 SQL Server 2005 中，在 LIMITED 模式下扫描堆的所有页。

在 LIMITED 模式下，compressed_page_count 为 NULL，这是因为数据库引擎只能扫描 B 树的非叶页和堆的 IAM 和 PFS 页。使用 SAMPLED 模式可以获取 compressed_page_count 的估计&＃20540;，使用 DETAILED 模式可以获取 compressed_page_count 的实际&＃20540;。SAMPLED 模式将返回基于索引或堆中所有页的 1％样本的统计信息。如果索引或堆少于 10,000 页，则使用 DETAILED 模式代替 SAMPLED。

DETAILED 模式将扫描所有页并返回所有统计信息。

从 LIMITED 到 DETAILED 模式，速度将越来越慢，因为在每个模式中执行的任务越来越多。若要快速测量表或索引的大小或碎片级别，请使用 LIMITED 模式。它的速度最快，并且对于索引的 IN_ROW_DATA 分配单元中的每个非叶级别，不返回与其对应的一行。

最佳实践
请始终确保使用 DB_ID 或 OBJECT_ID 时返回了有效的 ID。例如，在使用 OBJECT_ID 时，请指定三部分的名称，如 OBJECT_ID(N'AdventureWorks2008R2.Person.Address')，或者在 sys.dm_db_index_physical_stats 函数中使用由函数返回的&＃20540;之前对这些&＃20540;进行测试。下面的示例 A 和 B 演示了一种指定数据库和对象 ID 的安全方法。

检测碎片
在对表进而对表中定义的索引进行数据修改（INSERT、UPDATE 和 DELETE 语句）的整个过程中都会出现碎片。由于这些修改通常并不在表和索引的行中平均分布，所以每页的填充度会随时间而改变。对于扫描表的部分或全部索引的查询，这种碎片会导致附加的页读取。从而延缓了数据的并行扫描。

SQL Server 2008 中的碎片计算算法比 SQL Server 2000 中的更精确。因此，碎片&＃20540;显得更高。例如，在 SQL Server 2000 中，如果一个表的第 11 页和第 13 页在同一区中，而第 12 页不在该区中，该表不被视为含有碎片。但是访问这些页需要两次物理 I/O 操作，因此，在 SQL Server 2008 中，这将算作碎片。

索引或堆的碎片级别显示在 avg_fragmentation_in_percent 列中。对于堆，此&＃20540;表示堆的区碎片。对于索引，此&＃20540;表示索引的逻辑碎片。与 DBCC SHOWCONTIG 不同，这两种情况下的碎片计算算法都会考虑跨越多个文件的存储，因而结果是精确的。

逻辑碎片

区碎片
这是堆的叶级页中出错区所占的百分比。出错区是指：包含堆的当前页的区不是物理上的包含前一页的区后的下一个区。

为了获得最佳性能，avg_fragmentation_in_percent 的&＃20540;应尽可能接近零。但是，从 0 到 10％范围内的&＃20540;都可以接受。所有减少碎片的方法（例如重新生成、重新组织或重新创建）都可用于降低这些&＃20540;。有关如何分析索引中碎片程度的详细信息，请参阅重新组织和重新生成索引。

减少索引中的碎片
当索引分段的方式导致碎片影响查询性能时，有三种方法可减少碎片：

1、删除并重新创建聚集索引。
重新创建聚集索引将对数据进行重新分布，从而使数据页填满。填充度可以使用 CREATE INDEX 中的 FILLFACTOR 选项进行配置。这种方法的缺点是索引在删除和重新创建周期内为脱机状态，并且操作属原子级。如果中断索引创建，则不能重新创建索引。有关详细信息，请参阅 CREATE INDEX (Transact-SQL)。

2、使用 ALTER INDEX REORGANIZE（代替 DBCC INDEXDEFRAG）按逻辑顺序重新排序索引的叶级页。由于这是联机操作，因此在语句运行时仍可使用索引。中断此操作时不会丢失已经完成的任务。此方法的缺点是在重新组织数据方面不如索引重新生成操作的效果好，而且不更新统计信息。

3、使用 ALTER INDEX REBUILD（代替 DBCC DBREINDEX）联机或脱机重新生成索引。有关详细信息，请参阅 ALTER INDEX (Transact-SQL)。

不需要仅因为碎片的原因而重新组织或重新生成索引。碎片的主要影响是，在索引扫描过程中会降低页的预读吞吐量。这将导致响应时间变长。如果含有碎片的表或索引中的查询工作负荷不涉及扫描（因为工作负荷主要是单独查找），则删除碎片可能不起作用。有关详细信息，请参阅此 Microsoft 网站。
注意：
如果在收缩操作中对索引进行部分或完全移动，则运行 DBCC SHRINKFILE 或 DBCC SHRINKDATABASE 可能产生碎片。因此，如果必须执行收缩操作，则不应在删除碎片后进行。

减少堆中的碎片
若要减少堆的区碎片，请对表创建聚集索引，然后删除该索引。在创建聚集索引时将重新分布数据。同时会考虑数据库中可用空间的分布，从而使其尽可能优化。当删除聚集索引以重新创建堆时，数据不会移动并保持最佳位置。有关如何执行这些操作的信息，请参阅 CREATE INDEX 和 DROP INDEX。

压缩大型对象数据
默认情况下，ALTER INDEX REORGANIZE 语句将压缩包含大型对象 (LOB) 数据的页。因为不会释放空的 LOB 页，所以在删除大量 LOB 数据或 LOB 列时，压缩此数据可改善磁盘空间使用情况。

重新组织指定的聚集索引将压缩聚集索引中包含的所有 LOB 列。重新组织非聚集索引将压缩作为索引中非键（已包括）列的所有 LOB 列。如果语句中指定 ALL，则将对与指定表或视图关联的所有索引进行重新组织。此外，将压缩与聚集索引、基础表或带有包含列的非聚集索引关联的所有 LOB 列。

评估磁盘空间使用状况
avg_page_space_used_in_percent 列指示页填充度。为了使磁盘使用状况达到最优，对于没有很多随机插入的索引，此&＃20540;应接近 100％。但是，对于具有很多随机插入且页很满的索引，其页拆分数将不断增加。这将导致更多的碎片。因此，为了减少页拆分，此&＃20540;应小于 100％。使用指定的 FILLFACTOR 选项重新生成索引可以改变页填充度，以便符合索引中的查询模式。有关填充因子的详细信息，请参阅填充因子。此外，ALTER INDEX REORGANIZE 还试图通过将页填充到上一次指定的 FILLFACTOR 来压缩索引。这会增加 avg_space_used_in_percent 的&＃20540;。请注意，ALTER INDEX REORGANIZE 不会降低页填充度。相反，必须执行索引重新生成。

评估索引碎片
碎片由分配单元中同一文件内的物理连续的叶级页组成。一个索引至少有一个碎片。索引可以包含的最大碎片数等于索引的页级别页数。碎片越大，意味着读取相同页数所需的磁盘 I/O 越少。因此，avg_fragment_size_in_pages &＃20540;越大，范围扫描的性能越好。avg_fragment_size_in_pages 和 avg_fragmentation_in_percent &＃20540;成反比。因此，重新生成或重新组织索引会减少碎片数量，但同时增大碎片大小。

推荐阅读

oracle
SQL基础入门与数据库体系概述

本文介绍了数据库体系的基础知识，涵盖关系型数据库（如MySQL）和非关系型数据库（如MongoDB）的基本操作及高级功能。通过三个阶段的学习路径——基础、优化和部署，帮助读者全面掌握数据库的使用和管理。 ... [详细]

蜡笔小新 2024-12-22 19:17:15
insert
SQL Server 相关

1.执行sqlsever存储过程，消息：SQLServer阻止了对组件“AdHocDistributedQueries”的STATEMENT“OpenRowsetOpenDatas ... [详细]

蜡笔小新 2024-12-21 20:05:21
insert
采用IKE方式建立IPsec安全隧道

一、【组网和实验环境】按如上的接口ip先作配置，再作ipsec的相关配置，配置文本见文章最后本文实验采用的交换机是H3C模拟器，下载地址如 ... [详细]

蜡笔小新 2024-12-22 20:24:15
数据库
福克斯新闻数据库配置失误导致1300万条敏感记录泄露

由于数据库配置错误，福克斯新闻暴露了一个58GB的未受保护数据库，其中包含约1300万条网络内容管理记录。任何互联网用户都可以访问这些数据，引发了严重的安全风险。 ... [详细]

蜡笔小新 2024-12-22 17:57:10
elasticsearch
ZooKeeper集群脑裂问题及其解决方案

本文深入探讨了ZooKeeper集群中可能出现的脑裂问题，分析其成因，并提供了多种有效的解决方案，确保集群在高可用性环境下的稳定运行。 ... [详细]

蜡笔小新 2024-12-22 17:19:52
数据库
优化DB2数据库性能的关键策略

本文详细介绍了优化DB2数据库性能的多种方法，涵盖统计信息更新、缓冲池调整、日志缓冲区配置、应用程序堆大小设置、排序堆参数调整、代理程序管理、锁机制优化、活动应用程序限制、页清除程序配置、I/O服务器数量设定以及编入组提交数调整等方面。通过这些技术手段，可以显著提升数据库的运行效率和响应速度。 ... [详细]

蜡笔小新 2024-12-22 16:20:33
数据库
如何用ping测试网络连接

如何使用Ping命令来测试网络连接？当网卡安装和有关参数配置完成后，可以使用ping命令来测试一下网络是否连接成功。以winXP为例1、打开XP下DOS窗口具体操作是点击“开始”菜 ... [详细]

蜡笔小新 2024-12-22 07:41:31
oracle
深入解析Java虚拟机（JVM）架构与原理

本文旨在为读者提供对Java虚拟机（JVM）的全面理解，涵盖其主要组成部分、工作原理及其在不同平台上的实现。通过详细探讨JVM的结构和内部机制，帮助开发者更好地掌握Java编程的核心技术。 ... [详细]

蜡笔小新 2024-12-21 23:50:40
oracle
Android 开发面试经验与心得

本文回顾了2017年的转型和2018年的收获，分享了几家知名互联网公司提供的工作机会及面试体验。 ... [详细]

蜡笔小新 2024-12-21 16:10:08
oracle
CodeChef 2014 April Challenge - Chef的最终对决：数据结构与整体二分的应用

本题探讨了在大数据结构背景下，如何通过整体二分和CDQ分治等高级算法优化处理复杂的时间序列问题。题目设定包括节点数量、查询次数和权重限制，并详细分析了解决方案中的关键步骤。 ... [详细]

蜡笔小新 2024-12-22 19:34:39
oracle
深入理解K近邻分类算法：机器学习100天系列（26）

本文详细介绍了K近邻分类算法的理论基础，探讨其工作原理、应用场景以及潜在的局限性。作为机器学习100天系列的一部分，旨在为读者提供全面且深入的理解。 ... [详细]

蜡笔小新 2024-12-22 18:18:57
json
优化C++项目中的JSON处理：选择高性能的RapidJSON库

在高并发需求的C++项目中，我们最初选择了JsonCpp进行JSON解析和序列化。然而，在处理大数据量时，JsonCpp频繁抛出异常，尤其是在多线程环境下问题更为突出。通过分析发现，旧版本的JsonCpp存在多线程安全性和性能瓶颈。经过评估，我们最终选择了RapidJSON作为替代方案，并实现了显著的性能提升。 ... [详细]

蜡笔小新 2024-12-21 18:13:59
数据库
Java EE开发技术课程学习平台设计与实现

本文详细介绍了一款基于Java EE开发技术的在线学习平台，涵盖系统设计、流程分析、功能模块及源码分享等内容，提供从需求分析到部署的全面指导。 ... [详细]

蜡笔小新 2024-12-21 17:50:52
数据库
智能医疗：迈向未来的新篇章

智能医疗，即通过先进的物联网技术和信息平台，实现患者、医护人员和医疗机构之间的高效互动。它不仅提升了医疗服务的便捷性和质量，还推动了整个医疗行业的现代化进程。 ... [详细]

蜡笔小新 2024-12-21 17:01:59
数据库
解读常见交通标线，确保安全出行

在日常驾驶中，除了各种交通标志外，地面的交通标线也至关重要。忽视这些标线可能导致违规扣分、罚款，甚至引发交通事故。本文将详细介绍几种常见的交通标线及其含义，帮助您更好地理解并遵守交通规则。 ... [详细]

蜡笔小新 2024-12-21 15:17:17

留香1980

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章