热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

从平衡树到oracleb-tree索引的原理探索

从平衡树到oracleb-tree索引的原理探索先话唠一下,oracle索引,有两类运用较广:1)b-tree:OLTP(面向交易)2)bitmap:OLAP(面向分析)步入正题,先搭建测试环境:[sql]SQL>createtablett...SyntaxHighligh

从平衡树到oracle b-tree索引的原理探索
 
先话唠一下,oracle索引,有两类运用较广:
    1)b-tree:OLTP(面向交易)
    2)bitmap:OLAP(面向分析)
    步入正题,先搭建测试环境:
[sql] 
SQL> create table tt as select * from dba_objects;  
  
表已创建。  
SQL> select count(*) from tt;  
  
  COUNT(*)  
----------  
     50441  
    www.2cto.com  
SQL> insert into tt select * from tt;  
  
已创建50441行。  
  
SQL> /  
  
已创建100882行。  
  
SQL> /  
  
已创建201764行。  
  
SQL> /  
  
已创建403528行。  
  
SQL> /  
  
已创建807056行。  
  
SQL> create index tt_index on tt(object_id) tablespace users;  
  
索引已创建。  
 
    把索引tt_index的结构给dump出来:
[sql] 
SQL> select object_id from dba_objects where object_name='TT_INDEX';  
    www.2cto.com  
 OBJECT_ID  
----------  
     53042  
SQL> alter session set events 'immediate trace name treedump level 53042';  
  
会话已更改。  
  
SQL> show parameter user_dump_dest  
  
NAME                                 TYPE  
------------------------------------ ----------------------  
VALUE  
------------------------------  
user_dump_dest                       string  
G:\ORACLE\PRODUCT\10.2.0\ADMIN  
\ORCL\UDUMP  
SQL> select distinct sid from v$mystat;  
  
       SID  
----------  
       147  
  
SQL> select paddr from v$session where sid=147;  
  
PADDR  
--------  
CA280DDC  
  
SQL> select spid from v$process where addr='CA280DDC';  
    www.2cto.com  
SPID  
------------------------  
5360  
    到udump,把进程号为5360的文件打开,部分内容如下:
 
[sql] 
*** 2012-08-07 01:21:34.944  
*** ACTION NAME:() 2012-08-07 01:21:34.902  
*** MODULE NAME:(SQL*Plus) 2012-08-07 01:21:34.902  
*** SERVICE NAME:(SYS$USERS) 2012-08-07 01:21:34.902  
*** SESSION ID:(147.92) 2012-08-07 01:21:34.902  
----- begin tree dump  
branch: 0x10001bc 16777660 (0: nrow: 7, level: 2)  
   branch: 0x100595f 16800095 (-1: nrow: 578, level: 1)  
      leaf: 0x10001bd 16777661 (-1: nrow: 513 rrow: 513)  
      leaf: 0x10001be 16777662 (0: nrow: 513 rrow: 513)  
      leaf: 0x10001bf 16777663 (1: nrow: 513 rrow: 513)  
      leaf: 0x10001c0 16777664 (2: nrow: 513 rrow: 513)  
      leaf: 0x10001c1 16777665 (3: nrow: 513 rrow: 513)  
      leaf: 0x10001c2 16777666 (4: nrow: 513 rrow: 513)  
      leaf: 0x10001c3 16777667 (5: nrow: 484 rrow: 484)  
      leaf: 0x10001c4 16777668 (6: nrow: 478 rrow: 478)  
      leaf: 0x10001c5 16777669 (7: nrow: 478 rrow: 478)  
      leaf: 0x10001c6 16777670 (8: nrow: 478 rrow: 478)  
      leaf: 0x10001c7 16777671 (9: nrow: 478 rrow: 478)  
      leaf: 0x10001c8 16777672 (10: nrow: 478 rrow: 478)  
      leaf: 0x10001ca 16777674 (11: nrow: 481 rrow: 481)  
      leaf: 0x10001cb 16777675 (12: nrow: 478 rrow: 478)  
      leaf: 0x10001cc 16777676 (13: nrow: 478 rrow: 478)  
      leaf: 0x10001cd 16777677 (14: nrow: 478 rrow: 478)  
      leaf: 0x10001ce 16777678 (15: nrow: 478 rrow: 478)  
      leaf: 0x10001cf 16777679 (16: nrow: 478 rrow: 478)  
  www.2cto.com  
    由此可证明:b-tree中的b是balance,是棵平衡树。否则,一个branch下面只有两个leaf,才是二叉树。
    上面:0x10001bd (16进制)和16777661(10进制)这两个,其实,是一样的。
 
[sql] 
SQL> select to_number('10001bd','xxxxxxx') from dual;  
  
TO_NUMBER('10001BD','XXXXXXX')  
------------------------------  
                      16777661  
    而且,16777661包含两部分:文件号、数据块号。意指:这个地址是哪个数据文件上的第几个块  www.2cto.com  
 
[sql] 
SQL> select dbms_utility.data_block_address_file( 16777661) from dual  
  
DBMS_UTILITY.DATA_BLOCK_ADDRESS_FILE(16777661)  
----------------------------------------------  
                                             4  
  
SQL> select dbms_utility.data_block_address_block( 16777661) from dua  
  
DBMS_UTILITY.DATA_BLOCK_ADDRESS_BLOCK(16777661)  
-----------------------------------------------  
                                            445  
    由上,可得:4号文件的第445个块
    将tt_index的内容给dump出来一下:
[sql] 
SQL> alter system dump datafile 4 block 445;  
  
系统已更改。  
  www.2cto.com  
    部分内容摘入如下:
[sql] 
row#0[8024] flag: ------, lock: 0, len=12  
col 0; len 2; (2):  c1 03  
col 1; len 6; (6):  01 00 01 ac 00 2d  
row#1[8012] flag: ------, lock: 0, len=12  
col 0; len 2; (2):  c1 03  
col 1; len 6; (6):  01 00 05 36 00 40  
row#2[8000] flag: ------, lock: 0, len=12  
col 0; len 2; (2):  c1 03  
col 1; len 6; (6):  01 00 08 01 00 1b  
row#3[7988] flag: ------, lock: 0, len=12  
col 0; len 2; (2):  c1 03  
col 1; len 6; (6):  01 00 0a a2 00 2d  
row#4[7976] flag: ------, lock: 0, len=12  
col 0; len 2; (2):  c1 03  
col 1; len 6; (6):  01 00 0d 69 00 48  
    tt表最小的object_id为2,对应的便是row#0[8024],那么2在oracle中的16进制是如何存储的呢?
[sql] 
SQL> select dump(2,16) from dual;  
  
DUMP(2,16)  
----------------------------------  
Typ=2 Len=2: c1,3  
  www.2cto.com  
    由此,可知:2的存储是c1 03.也就是,第0行的第一列存储的值是2.
    意味着,在索引的叶子节点里,我们在哪一列上创建索引,其实,oracle就是把该列的值保存到索引的叶子节点里。
    索引里第一行第2列16进制数:01 00 01 ac 00 2d和rowid有啥关系呢?
[sql] 
SQL> select object_id,rowid from tt  
  2   where object_id=2  
  3   order by object_id,rowid;  
  
 OBJECT_ID ROWID  
---------- ------------------  
         2 AAAM8xAAEAAAAGsAAt  
         2 AAAM8xAAEAAAAU2ABA  
         2 AAAM8xAAEAAAAgBAAb  
         ...  
    其实,索引里第一行第2列16进制数:01 00 01 ac 00 2d表示的是rowid里面后三部分,也就是:fno、bno、rno。
  www.2cto.com  
    rowid:AAAM8x  AAE  AAAAGs  AAt。通过进制的转换,AAE  AAAAGs  AAt和01 00 01 ac 00 2d是一样的。
    为什么只有后三个部分呢?说白点,书的目录会把书名给包括进去吗?书名就是对象编号、目录就是索引。
    到此,我们把索引的内部结构给构造出来:
    object_id  rowid(后三部分)
    ...             ...
 
    草图如下:

 
作者 linwaterbin

推荐阅读
  • 精选30本C# ASP.NET SQL中文PDF电子书合集
    欢迎订阅我们的技术博客,获取更多关于C#、ASP.NET和SQL的最新资讯和资源。 ... [详细]
  • MySQL 数据库迁移指南:从本地到远程及磁盘间迁移
    本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移,包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机,以及解决迁移过程中可能遇到的问题。 ... [详细]
  • 本文详细探讨了JDBC(Java数据库连接)的内部机制,重点分析其作为服务提供者接口(SPI)框架的应用。通过类图和代码示例,展示了JDBC如何注册驱动程序、建立数据库连接以及执行SQL查询的过程。 ... [详细]
  • MySQL索引详解与优化
    本文深入探讨了MySQL中的索引机制,包括索引的基本概念、优势与劣势、分类及其实现原理,并详细介绍了索引的使用场景和优化技巧。通过具体示例,帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]
  • 本文探讨了领域驱动设计(DDD)的核心概念、应用场景及其实现方式,详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型,展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]
  • 本文探讨了MariaDB在当前数据库市场中的地位和挑战,分析其可能面临的困境,并提出了对未来发展的几点看法。 ... [详细]
  • 本文探讨了在Oracle数据库中,动态SQL语句的执行及其对事务管理的影响,特别是关于回滚操作的有效性。重点讨论了一个具体场景:将预警短信从当前表迁移到历史表时遇到的字段长度不匹配问题及相应的异常处理。 ... [详细]
  • 探讨如何真正掌握Java EE,包括所需技能、工具和实践经验。资深软件教学总监李刚分享了对毕业生简历中常见问题的看法,并提供了详尽的标准。 ... [详细]
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • 作者:守望者1028链接:https:www.nowcoder.comdiscuss55353来源:牛客网面试高频题:校招过程中参考过牛客诸位大佬的面经,但是具体哪一块是参考谁的我 ... [详细]
  • 本文将深入探讨使用IMPDP工具进行分区表导入时需要注意的事项,涵盖最佳实践和常见问题。通过详细的分析与解释,帮助读者更好地理解和应用这些知识。 ... [详细]
  • PostgreSQL 10 离线安装指南
    本文详细介绍了如何在无法联网的服务器上进行 PostgreSQL 10 的离线安装,并涵盖了从下载安装包到配置远程访问的完整步骤。 ... [详细]
  • 探讨如何使用正则表达式从类 SQL 查询语句中提取字段及其对应的值。 ... [详细]
  • TCP长连接设备管理平台:架构与功能概览
    本文介绍了基于TCP长连接的设备管理平台的设计理念、技术选型及主要功能模块。最初,项目旨在实现简单的协议测试,但随着需求扩展,逐步演变为一个完整的前后端分离系统。 ... [详细]
  • Startup 类配置服务和应用的请求管道。Startup类ASP.NETCore应用使用 Startup 类,按照约定命名为 Startup。 Startup 类:可选择性地包括 ... [详细]
author-avatar
一二三八嘎
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有