热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

MySQL底层存储BTree和B+Tree原理分析

1.B-Tree的原理分析&

1.B-Tree的原理分析

(1)什么是B-Tree

  • B-树,全称是 Balanced Tree,是一种多路平衡查找树。

  • 一个节点包括多个key (数量看业务),具有M阶的B树,每个节点最多有M-1个Key。

  • 节点的key元素个数就是指这个节点能够存储几个数据。

  • 每个节点最多有m个子节点,最少有M/2个子节点,其中M>2。

  • 数据集合分布在整个树里面,叶子节点和非叶子节点都存储数据;类似在整个树里面做一次二分查找。

  • B 树相对于平衡二叉树,每个节点存储了更多的键值(key)和数据(data)。

  • 实际业务中B树的阶数一般大于100,存储大量数据,B树高度也会很低,查询效率会更高。

  • 备注

    • 每个节点拥有最多的子节点,子节点的个数一般称为阶。

    • 阶:m阶是代表每个节点最多有m个分支(子树)。

    • 树的度:这棵树里面节点最大的度。

    • 节点的度:当前节点有几个子节点。

在这里插入图片描述

(2)B树插入原理

  • 每个节点的数据都是顺序存储,具有M阶的B树,树的阶数表示每个结点最多可以有多少个子结点

在这里插入图片描述

(3)B树的应用场景

  • 在数据库中,B树用来维护索引,用来提高查询效率,一个节点可以存储整个页(即磁盘块)
  • 在文件系统中,B树用来存储文件的目录信息,提高文件的访问效率
  • 在操作系统中,B树可以用来存储内存管理信息,提高内存的分配效率

(4)思考:3层的B树,阶数为1024,最多容纳多少个元素?

  • B树的阶数表示每个结点最多可以有多少个子结点,因此B树的阶数为1024,表示每个结点最多可以有1024个子结点

  • 由于B树的3层,因此根结点可以有1024个子结点,每个子结点又可以有1024个子结点

  • 因此一个3层的B树,阶数为1024,B树的每一层的节点数都是阶数的幂次方

  • 计算总容量 把每一层的节点数相加 即10241+10242+1024^3 大约是 11亿个节点,假如每个节点放一个元素就是11亿个

  • 所以在10亿个数据中找目标值,常规小于3次磁盘IO即可找到目标值,比平衡二叉树的30次提升了不少

    • 平衡二叉树的高度就等于每次查询数据时磁盘 IO 操作的次数。

    • 10亿的数据量,log2(N)约等于30次磁盘IO,

      • log2(N) 相当于2的多少次方(立方)等于N,例:log2 (8)= 3
      • 2的30次方=1073741824,所以就是30次磁盘IO

2.B+Tree的原理分析

(1)什么是B+Tree

  • 是B树的一种变形形式,B+树上的叶子结点存储关键字以及相应记录的地址,同等存储空间下比B-Tree存储更多key
  • 非叶子节点不对关键字记录的指针进行保存,只进行数据索引 , 树的层级会更少 , 所有叶子节点都在同一层,
  • 叶子节点的关键字从小到大有序排列,叶子节点之间用指针连接, 构成有序链表(稠密索引)
  • B+树上每个非叶子节点之间是一个双向链表进行链接,而叶子节点中的数据都是使用单向链表链接
  • 查找特点
    • 当索引部分某个结点的关键字与所查的关键字相等时,并不停止查找
    • 继续沿着关键字的指针向下,每次查询必须到叶子节点才能真正获取到相关数据
    • B+Tree叶子节点相连接,对树的遍历就是只需要 一次线性遍历叶子节点
    • 由于叶子节点的数据是顺序排列,方便区间查找
    • 在B+树完成范围查找,排序查找,分组查找,去重查找 比B树效率也比较高

在这里插入图片描述

(2)B+Tree插入流程解析

在这里插入图片描述

  • 总结

    • B树和B+树的最大区别在于非叶子节点是否存储数据

    • B+树非叶子节点只是当索引使用,同等空间下B+树存储更多key

    • B树,非叶子节点和叶子节点都会存储数据,找到对应节点就有对应的数据

    • B+树, 只有叶子节点才会存储数据,存储的数据都是在一行上,找到非叶子节点的key,还需要继续找到叶子节点才可以获取数据

    • B树的节点包括了key-value,所以找到对应的key即可找到对应的value,不用在继续寻找

    • 两种树各有优缺点和应用场景


3.B+Tree树应用之Mysql索引底层原理剖析


  • 背景

    • Mysql数据库是大家用最多的,查询是最高频使用的操作

    • 在多数数据库的设计里面,会用B-Tree或B+Tree做索引提高查询效率

  • 基于一张数据库的表数据进行查询(类似mysql的user表)

  • 构建索引:id用做key,然后data是数据的存储地址


内存地址idphonenameAge
0xFS84313820835467张三43
0xER98415738235423李四20
0x32421212152354223王五18
0x93100012152356324赵六30
0xAP234118735622097李祥19
0xSQ… 1千万条数据

  • 精确查找 id=2341的数据 select * from user where id = 2341

    • 未使用索引

      • 自上而下查找数据,一行行遍历,5次才找到数据
    • 使用索引

      • id建立主键索引(B+Tree结构),对应的数据存储数据的地址,2次找到数据,且数据量越多效果越明显
      • 根节点是常驻内存的,不需要进行IO操作
  • 范围查找 id>1000 和 id <4212 的用户

    • 未使用索引

      • 自上而下查找数据&#xff0c;一行行遍历
    • 使用索引

      • id建立主键索引&#xff08;B&#43;Tree结构&#xff09;&#xff0c;由于本身是有序链表&#xff0c;所以顺序查找即可
  • Mysql的InnoDB中的索引结构与MyISAM的索引结构的区别

  • InnoDB引擎,表数据文件按B&#43;Tree组织的&#xff0c;叶节点data域保存完整行数据, 树上的key就是主键, 以主键构建的B&#43;树索引

    • 这种索引叫做聚集索引&#xff08;聚簇索引 clustered index&#xff09;

    • 聚簇索引一般为主键索引&#xff0c;而主键一个表中只能有一个&#xff0c;所以聚集索引一个表只能有一个

    • 聚簇索引叶子节点存储的是行数据&#xff0c;而非聚簇索引叶子节点存储的是聚簇索引&#xff08;通常是主键 ID&#xff09;

  • MyISAM引擎&#xff1a;索引文件和数据文件是分开的&#xff0c;索引结构的叶子节点放的是指向数据的主键&#xff08;或者是地址&#xff09;构建的B&#43;树索引

    • 这种索引叫做非聚集索引、二级索引、辅助索引&#xff08;非聚簇索引 nonclustered index&#xff09;
    • 非聚集索引一个表可以存在多个
    • 叶子节点中保存的不是实际数据&#xff0c;而是主键&#xff0c;获得主键值后去聚簇索引中获得数据行
  • 注意

    • 非聚簇索引的叶子节点上存储的并不是真正的行数据&#xff0c;而是主键 ID或记录的地址

    • 当使用非聚簇索引进行查询时&#xff0c;会得到一个主键 ID&#xff0c;再使用主键 ID 去聚簇索引上找真正的行数据&#xff0c;把这个过程称之为回表查询

    • 所以聚簇索引查询效率更高&#xff0c;而非聚簇索引需要进行回表查询&#xff0c;性能不如聚簇索引

    • 非聚簇索引的叶子节点上存储的并不是真正的行数据&#xff0c;而是主键 ID或记录的地址

    • 当使用非聚簇索引进行查询时&#xff0c;会得到一个主键 ID&#xff0c;再使用主键 ID 去聚簇索引上找真正的行数据&#xff0c;把这个过程称之为回表查询

    • 所以聚簇索引查询效率更高&#xff0c;而非聚簇索引需要进行回表查询&#xff0c;性能不如聚簇索引

在这里插入图片描述


推荐阅读
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
  • 安装mysqlclient失败解决办法
    本文介绍了在MAC系统中,使用django使用mysql数据库报错的解决办法。通过源码安装mysqlclient或将mysql_config添加到系统环境变量中,可以解决安装mysqlclient失败的问题。同时,还介绍了查看mysql安装路径和使配置文件生效的方法。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文介绍了在SpringBoot中集成thymeleaf前端模版的配置步骤,包括在application.properties配置文件中添加thymeleaf的配置信息,引入thymeleaf的jar包,以及创建PageController并添加index方法。 ... [详细]
  • 本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识,包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说,本文提供了一些有价值的参考内容。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • 基于事件驱动的并发编程及其消息通信机制的同步与异步、阻塞与非阻塞、IO模型的分类
    本文介绍了基于事件驱动的并发编程中的消息通信机制,包括同步和异步的概念及其区别,阻塞和非阻塞的状态,以及IO模型的分类。同步阻塞IO、同步非阻塞IO、异步阻塞IO和异步非阻塞IO等不同的IO模型被详细解释。这些概念和模型对于理解并发编程中的消息通信和IO操作具有重要意义。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • 高质量SQL书写的30条建议
    本文提供了30条关于优化SQL的建议,包括避免使用select *,使用具体字段,以及使用limit 1等。这些建议是基于实际开发经验总结出来的,旨在帮助读者优化SQL查询。 ... [详细]
  • 本文讨论了在数据库打开和关闭状态下,重新命名或移动数据文件和日志文件的情况。针对性能和维护原因,需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况,以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]
  • vue使用
    关键词: ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
author-avatar
木卫二
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有