Oracle收集索引统计信息

作者：若我倆有了愛 | 来源：互联网 | 2014-05-21 15:26

相信大家对索引结构非常熟悉了，它是由根、支、叶组成。当然这里指的是常用的B&43;树索引。我们依然使用《Oracle收集表与列统计信息》里的测试表。下面分析索引统计信息的相关内容。

相信大家对索引结构非常熟悉了，它是由根、支、叶组成。当然这里指的是常用的B+树索引。我们依然使用《Oracle收集表与列统计信息》里的测试表。下面分析索引统计信息的相关内容。

一、如何查询索引统计信息

查询索引统计信息需要用到user_ind_statistics，下面是典型的查询语句。

SELECT INDEX_NAME              AS NAME,
       BLEVEL,
       LEAF_BLOCKS             AS LEAF_BLKS,
       DISTINCT_KEYS           AS DST_KEYS,
       NUM_ROWS,
       CLUSTERING_FACTOR       AS CLUST_FACT,
       AVG_LEAF_BLOCKS_PER_KEY AS LEAF_PER_KEY,
       AVG_DATA_BLOCKS_PER_KEY AS DATA_PER_KEY
  FROM USER_IND_STATISTICS
 WHERE TABLE_NAME = &＃39;T&＃39;;
 
 NAME           BLEVEL  LEAF_BLKS   DST_KEYS   NUM_ROWS CLUST_FACT LEAF_PER_KEY DATA_PER_KEY
---------- ---------- ---------- ---------- ---------- ---------- ------------ ------------
T_PK                1          2       1000       1000        978            1            1
T_VAL1_I            1          2        445        509        500            1            1
T_VAL2_I            1          3          6       1000        176            1           29

这里的几列具体含义是：

①blevel：也就是B-Tree level，比如从根到支再到叶，blevel为2，但索引的高度是blevel+1也就是3。

②leaf_block：索引中的叶子块数。

③distinct_keys：索引中的唯一键值总数。

④num_rows：索引中的键值数。

⑤clustering_factor：聚簇因子，它用来表征索引和数据之间的排序程度。这个因子的最小值是表里非空数据块的个数，最大值是索引的键数。下面研究如何计算聚簇因子。

二、如何计算聚簇因子

下面是计算聚簇因子的脚本，

CREATE OR REPLACE FUNCTION clustering_factor (
  p_owner IN VARCHAR2, 
  p_table_name IN VARCHAR2,
  p_column_name IN VARCHAR2
) RETURN NUMBER IS
  l_cursor             SYS_REFCURSOR;
  l_clustering_factor  BINARY_INTEGER := 0;
  l_block_nr           BINARY_INTEGER := 0;
  l_previous_block_nr  BINARY_INTEGER := 0;
  l_file_nr            BINARY_INTEGER := 0;
  l_previous_file_nr   BINARY_INTEGER := 0;
  BEGIN
  OPEN l_cursor FOR 
    &＃39;SELECT dbms_rowid.rowid_block_number(rowid) block_nr, &＃39;||
    &＃39;       dbms_rowid.rowid_to_absolute_fno(rowid, &＃39;&＃39;&＃39;||
                                             p_owner||&＃39;&＃39;&＃39;,&＃39;&＃39;&＃39;||
                                             p_table_name||&＃39;&＃39;&＃39;) file_nr &＃39;||
    &＃39;FROM &＃39;||p_owner||&＃39;.&＃39;||p_table_name||&＃39; &＃39;||
    &＃39;WHERE &＃39;||p_column_name||&＃39; IS NOT NULL &＃39;||
    &＃39;ORDER BY &＃39; || p_column_name;
  LOOP
    FETCH l_cursor INTO l_block_nr, l_file_nr;
    EXIT WHEN l_cursor%NOTFOUND;
    IF (l_previous_block_nr <> l_block_nr OR l_previous_file_nr <> l_file_nr)
    THEN
      l_clustering_factor := l_clustering_factor + 1;
    END IF;
    l_previous_block_nr := l_block_nr;
    l_previous_file_nr := l_file_nr;
  END LOOP;
  CLOSE l_cursor;
  RETURN l_clustering_factor;
END;
/

这个函数表示的一些含义说明一下，首先定义了一个函数，包含三个参数：所属、表名、列名，还定义了若干个返回值变量。接着定义了一个游标，该游标是根据所传入的参数，返回每条记录所在的块号、文件号。接着遍历游标，提取每一个记录的数据块号与文件号，若数据块号不与前一个数据块号相同，或者文件号不与前一个文件号相同，则聚簇因子加一。

下面验证这个算法的正确性，

SELECT I.INDEX_NAME,
       I.CLUSTERING_FACTOR,
       CLUSTERING_FACTOR(USER, I.TABLE_NAME, IC.COLUMN_NAME) AS MY_CLSTF
  FROM USER_INDEXES I, USER_IND_COLUMNS IC
 WHERE I.TABLE_NAME = &＃39;T&＃39;
   AND I.INDEX_NAME = IC.INDEX_NAME;


INDEX_NAME                     CLUSTERING_FACTOR   MY_CLSTF
------------------------------ ----------------- ----------
T_PK                                         972        972
T_VAL1_I                                     506        506
T_VAL2_I                                     178        178

可以看出，结果中用脚本中的函数算出的聚簇因子与oracle自带的clustering_factor列结果完全一致。

算法

推荐阅读

算法
非公版RTX 3080显卡的革新与亮点

本文深入探讨了图形显卡的进化历程，重点介绍了非公版RTX 3080显卡的技术特点和创新设计。 ... [详细]

蜡笔小新 2024-12-28 13:07:40
算法
深入理解OAuth认证机制

本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准，旨在为第三方应用提供安全的用户资源访问授权，同时确保用户的账户信息（如用户名和密码）不会暴露给第三方。 ... [详细]

蜡笔小新 2024-12-28 12:07:46
算法
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
算法
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
算法
C++实现经典排序算法

本文详细介绍了七种经典的排序算法及其性能分析。每种算法的平均、最坏和最好情况的时间复杂度、辅助空间需求以及稳定性都被列出，帮助读者全面了解这些排序方法的特点。 ... [详细]

蜡笔小新 2024-12-27 19:25:14
算法
使用动态规划算法求解0-1背包问题

本文介绍如何利用动态规划算法解决经典的0-1背包问题。通过具体实例和代码实现，详细解释了在给定容量的背包中选择若干物品以最大化总价值的过程。 ... [详细]

蜡笔小新 2024-12-27 19:17:15
算法
深入理解设计模式与七大原则

本文详细探讨了Java中的24种设计模式及其应用，并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类，帮助开发者更好地理解和应用这些模式，提升代码质量和可维护性。 ... [详细]

蜡笔小新 2024-12-27 19:10:10
算法
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
算法
USACO 2014 Jan - Moolympics区间记录优化算法

题目描述：给定n个半开区间[a, b)，要求使用两个互不重叠的记录器，求最多可以记录多少个区间。解决方案采用贪心算法，通过排序和遍历实现最优解。 ... [详细]

蜡笔小新 2024-12-27 18:14:31
机器学习
深入理解C++中的KMP算法：高效字符串匹配的利器

本文详细介绍C++中实现KMP算法的方法，探讨其在字符串匹配问题上的优势。通过对比暴力匹配（BF）算法，展示KMP算法如何利用前缀表优化匹配过程，显著提升效率。 ... [详细]

蜡笔小新 2024-12-27 14:45:30
算法
LeetCode 991：故障计算器的最优解法

探讨一个显示数字的故障计算器，它支持两种操作：将当前数字乘以2或减去1。本文将详细介绍如何用最少的操作次数将初始值X转换为目标值Y。 ... [详细]

蜡笔小新 2024-12-27 14:34:44
算法
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
算法
设计一个安全的加密与验证算法

本文探讨如何设计一个安全的加密和验证算法，确保生成的密码具有高随机性和低重复率，并提供相应的验证机制。 ... [详细]

蜡笔小新 2024-12-27 13:49:45
机器学习
深入解析：手把手教你构建决策树算法

本文详细介绍了机器学习中广泛应用的决策树算法，通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字，建议阅读时间5分钟。 ... [详细]

蜡笔小新 2024-12-27 13:44:59
算法
C语言实现小写金额转换为大写金额

在金融和会计领域，准确无误地填写票据和结算凭证至关重要。这些文件不仅是支付结算和现金收付的重要依据，还直接关系到交易的安全性和准确性。本文介绍了一种使用C语言实现小写金额转换为大写金额的方法，确保数据的标准化和规范化。 ... [详细]

蜡笔小新 2024-12-27 12:39:06

若我倆有了愛

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章