热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

MySQL索引的数据结构用B+树的原因

MySQL选择使用B+树做索引不是因为B+数好看,也不是因为B+数好吃,因为货比三家后发现B+数更合适而已。为什么合适,怎样才算合适,得看索引使用场景以及跟其他数据结构进行对比。

首先,索引的出现是为了让查询更高效,一个适用于大多数情形并能显著提升查询效率的数据结构才是最合适做索引的。

第一个上场的是hash。想想Java中的HashMap数据结构就知道,它的优点是通过key可以快速找到对应的数据,JDK8将红黑树加入后性能更上一层楼。那么为什么不适合做索引的数据结构呢?就一点直接让它pass了:不能支持范围查找。因为hash算法中散列是无序的。

第二个上场的是二叉搜索树。二叉查找树优点:有序,查询快。因为所有左子树都比根节点小,所有右子树都比根节点大,所以范围查找也很快。为什么会被pass呢?因为它可能会出现一种极端情况:变成一个链表,极度不平衡。比如主键id默认自增就会出现这种情况,此时索引毫无优化性能可言。

MySQL索引的数据结构用B+树的原因

                                                                                  图:二叉搜索树

第三个上场的是红黑树。红黑树就是解决二叉搜索树倾斜的问题的,但是约束不够,解决的不够彻底,还是主键id自增这种常见场景下,在插入数据时红黑树虽然不会完全右倾,但是右倾趋势非常明显。

第四个上场的是平衡二叉搜索树。平衡因子等于1的时候,左右子树高度差不超过1,这样的二叉搜索树叫AVL,AVL的左右子树高度差约束使它拥有优秀的做索引的潜质:良好的查找性能(不存在极端情况)、支持快速的范围查找、有序。这里就需要考虑另一个问题了:数据库查询机制以及瓶颈。数据库查询瓶颈来自于磁盘IO,一次性从磁盘IO拿一条数据到内存和拿10条数据的消耗几乎时一样的。而二叉搜索数每个节点只存储一条数据,有没有更优的数据结构,一个节点上存多条数据呢?这样一次性可以读取到多条数据到内存就减少了IO访问频率。

B树就是一个节点可以存储两个key,B+树在B树的基础上,改变了节点里存的东西。B存储数据,而B+树存储数据对应的地址。B+树虽然在索引的基础上又加了一层类似于目录的东西,不过相对B树,它每层树中存储的key值更多了,树的高度更低,在数据量大的情况下更合适。

MySQL索引的数据结构用B+树的原因


推荐阅读
  • MySQL InnoDB 存储引擎索引机制详解
    本文深入探讨了MySQL InnoDB存储引擎中的索引技术,包括索引的基本概念、数据结构与算法、B+树的特性及其在数据库中的应用,以及索引优化策略。 ... [详细]
  • 我的读书清单(持续更新)201705311.《一千零一夜》2006(四五年级)2.《中华上下五千年》2008(初一)3.《鲁滨孙漂流记》2008(初二)4.《钢铁是怎样炼成的》20 ... [详细]
  • Windows操作系统提供了Encrypting File System (EFS)作为内置的数据加密工具,特别适用于对NTFS分区上的文件和文件夹进行加密处理。本文将详细介绍如何使用EFS加密文件夹,以及加密过程中的注意事项。 ... [详细]
  • 本文介绍了在Linux环境下如何有效返回命令行状态、上一级目录及快速查找头文件和函数定义的方法。包括处理长时间运行命令、编辑器退出技巧、目录导航以及文件搜索策略。 ... [详细]
  • TCP协议中的可靠传输机制分析
    本文深入探讨了TCP协议如何通过滑动窗口和超时重传来确保数据传输的可靠性,同时介绍了流量控制和拥塞控制的基本原理及其在实际网络通信中的应用。 ... [详细]
  • 本文详细介绍了如何在Oracle VM VirtualBox中实现主机与虚拟机之间的数据交换,包括安装Guest Additions增强功能,以及如何利用这些功能进行文件传输、屏幕调整等操作。 ... [详细]
  • 软件测试行业深度解析:迈向高薪的必经之路
    本文深入探讨了软件测试行业的发展现状及未来趋势,旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]
  • 如何在Django框架中实现对象关系映射(ORM)
    本文介绍了Django框架中对象关系映射(ORM)的实现方式,通过ORM,开发者可以通过定义模型类来间接操作数据库表,从而简化数据库操作流程,提高开发效率。 ... [详细]
  • 在日常生活中,支付宝已成为不可或缺的支付工具之一。本文将详细介绍如何通过支付宝实现免费提现,帮助用户更好地管理个人财务,避免不必要的手续费支出。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 如何将955万数据表的17秒SQL查询优化至300毫秒
    本文详细介绍了通过优化SQL查询策略,成功将一张包含955万条记录的财务流水表的查询时间从17秒缩短至300毫秒的方法。文章不仅提供了具体的SQL优化技巧,还深入探讨了背后的数据库原理。 ... [详细]
  • 本文详细介绍了在尝试启动MySQL服务时,如果遇到错误提示‘MySQL未运行,但锁定文件(/var/lock/subsys/mysql)存在’应如何处理,包括具体的操作步骤和可能的原因分析。 ... [详细]
  • 本文探讨了如何通过Service Locator模式来简化和优化在B/S架构中的服务命名访问,特别是对于需要频繁访问的服务,如JNDI和XMLNS。该模式通过缓存机制减少了重复查找的成本,并提供了对多种服务的统一访问接口。 ... [详细]
  • 如何在PHP中安装Xdebug扩展
    本文介绍了如何从PECL下载并编译安装Xdebug扩展,以及如何配置PHP和PHPStorm以启用调试功能。 ... [详细]
  • importjava.io.*;importjava.util.*;publicclass五子棋游戏{staticintm1;staticintn1;staticfinalintS ... [详细]
author-avatar
时光-Goslow
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有