热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

为什么MySQL数据库索引选择B+树

树是非常重要的一种数据结构,下面先讲几种常见的树结构,并分析它们为什么不适用于数据库索引。AVL树平衡二叉树的定义如下:首先符合二叉查找树的定义,其次必须满足任何节点的两个子节点的

树是非常重要的一种数据结构,下面先讲几种常见的树结构,并分析它们为什么不适用于数据库索引。


AVL树

平衡二叉树的定义如下:首先符合二叉查找树的定义,其次必须满足任何节点的两个子节点的高度差不大于1。平衡二叉树的查找速度确实很快,但是维护一棵平衡二叉树的代价是非常大的,不管我们执行插入还是删除,一旦不满足条件就需要通过左旋和右旋来保持平衡性,所以AVL树适合用于插入删除次数比较少,但查找多的情况。


红黑树

红黑树是一种弱平衡二叉树,相对于AVL树来说它的旋转次数会变少,所以适用于插入删除操作比较频繁的情况。红黑树的五条定义:



  • 所有节点不是红色就是黑色

  • 根节点是黑色

  • 叶子节点是null节点(空节点)且为黑色。

  • 同一路径中,不存在连续的红色节点。

  • 每个节点到它所能到的叶子节点经过的黑色节点数相同。

从根节点到叶子节点的所有路径中,最长路径不会超过最短路径的2倍,这保持了红黑树的弱平衡。在Java中,TreeMap、TreeSet都使用红黑树作为底层数据结构,JDK 1.8开始,HashMap也引入了红黑树:当冲突的链表长度超过8时,自动转为红黑树。


B+树

B+树是为磁盘或其他直接存取辅助设备设计的一种数据结构,在B+树中,非叶子节点相当于是叶子节点的索引,叶子节点才是存储数据的数据层,所有记录都是按键值的大小顺序存放在同一层的叶子结点上,由各叶子结点指针进行连接,B+树的插入必须保证插入后的叶子结点依然有序。(图片来自:https://blog.csdn.net/cxu123321/article/details/105665056/)

所以为什么B+树更适合数据库索引呢?

分析:

数据库的数据一般存储在磁盘中,读取数据时需要访问磁盘,我们知道读取磁盘数据的时间是由磁盘定位的时间+数据读取时间,而且定位的时间要远大于读取的时间,二叉树类型的结构可以将查询速度提升到\(O(log_2 N)\),但是最坏的情况要查找到二叉树的最深层,这在数据量很大时是不能接受的,B+树有高扇出性的特点,所以在这种情况下,矮胖的B+树相比于高瘦的AVL树(或者红黑树)就能减少访问的层数,提升查找效率。在数据库中,B+树的高度一般都在2-4层,这就是说查找某一键值的记录最多只需要2-4次IO。

那为什么采用B+树不用B树呢?

原因:

B树在提高了IO性能的同时并没有解决元素遍历效率低下的问题(B树因为分支结点同样存储着数据,所以如果要查找某个范围的数据,需要进行一次中序遍历)。为了解决这个问题,B+树应用而生,B+树的中间节点存储的只是叶子节点的索引,所有数据都存储在叶子结点中,所以只需要遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的,B树不支持这样的操作或者说效率太低。

参考:

https://blog.csdn.net/cxu123321/article/details/105665056/



推荐阅读
  • 本文介绍了Paxos的世界中关于复制日志与状态机的概念和重要性。通过存储日志来实现数据的持久化,并通过日志流来记录数据的变化,而不是直接持久化数据本身。这样做的好处是简化了持久化存储的操作,并且方便多机之间的数据同步。 ... [详细]
  • 安装mysqlclient失败解决办法
    本文介绍了在MAC系统中,使用django使用mysql数据库报错的解决办法。通过源码安装mysqlclient或将mysql_config添加到系统环境变量中,可以解决安装mysqlclient失败的问题。同时,还介绍了查看mysql安装路径和使配置文件生效的方法。 ... [详细]
  • 推荐一个ASP的内容管理框架(ASP Nuke)的优势和适用场景
    本文推荐了一个ASP的内容管理框架ASP Nuke,并介绍了其主要功能和特点。ASP Nuke支持文章新闻管理、投票、论坛等主要内容,并可以自定义模块。最新版本为0.8,虽然目前仍处于Alpha状态,但作者表示会继续更新完善。文章还分析了使用ASP的原因,包括ASP相对较小、易于部署和较简单等优势,适用于建立门户、网站的组织和小公司等场景。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • PHP设置MySQL字符集的方法及使用mysqli_set_charset函数
    本文介绍了PHP设置MySQL字符集的方法,详细介绍了使用mysqli_set_charset函数来规定与数据库服务器进行数据传送时要使用的字符集。通过示例代码演示了如何设置默认客户端字符集。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 本文介绍了在Hibernate配置lazy=false时无法加载数据的问题,通过采用OpenSessionInView模式和修改数据库服务器版本解决了该问题。详细描述了问题的出现和解决过程,包括运行环境和数据库的配置信息。 ... [详细]
  • Oracle Database 10g许可授予信息及高级功能详解
    本文介绍了Oracle Database 10g许可授予信息及其中的高级功能,包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明,指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 本文介绍了在SpringBoot中集成thymeleaf前端模版的配置步骤,包括在application.properties配置文件中添加thymeleaf的配置信息,引入thymeleaf的jar包,以及创建PageController并添加index方法。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文讨论了Alink回归预测的不完善问题,指出目前主要针对Python做案例,对其他语言支持不足。同时介绍了pom.xml文件的基本结构和使用方法,以及Maven的相关知识。最后,对Alink回归预测的未来发展提出了期待。 ... [详细]
  • qt学习(六)数据库注册用户的实现方法
    本文介绍了在qt学习中实现数据库注册用户的方法,包括登录按钮按下后出现注册页面、账号可用性判断、密码格式判断、邮箱格式判断等步骤。具体实现过程包括UI设计、数据库的创建和各个模块调用数据内容。 ... [详细]
  • 本文讨论了如何优化解决hdu 1003 java题目的动态规划方法,通过分析加法规则和最大和的性质,提出了一种优化的思路。具体方法是,当从1加到n为负时,即sum(1,n)sum(n,s),可以继续加法计算。同时,还考虑了两种特殊情况:都是负数的情况和有0的情况。最后,通过使用Scanner类来获取输入数据。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
author-avatar
坐看末日之景L_170
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有