当前位置: 开发笔记 > 编程语言 > 正文

深入解析MysqlInnoDb行格式、数据页结构和索引底层原理

作者：手机用户2602897795 | 来源：互联网 | 2023-10-13 15:51

我们用JDBC等连接MySQL其实就是，jdbc是客户端来连接MySQL服务器。Mysql服务器中负责对表中数据的读取和写入工作的部分是存储引擎，支持的

我们用JDBC 等连接MySQL 其实就是&＃xff0c;jdbc是客户端来连接MySQL服务器。

Mysql服务器中负责对表中数据的读取和写入工作的部分是存储引擎&＃xff0c;支持的存储引擎就是倒数第二行的innobd、memory、myisam等。

存储引擎的上一层是处理数据的&＃xff0c; 下一层是真的文件系统。

InnoDB

我们要讲的是innodb&＃xff0c;它是将表中的数据存储到磁盘上的存储引擎。

InnoDB存储引擎不需要一条一条的把记录从磁盘上读出来&＃xff0c;InnoDB采取的方式是&＃xff1a;

将数据划分为若干个页&＃xff0c;以页作为磁盘和内存之间交互的基本单位&＃xff0c;

InnoDB中页的大小一般为 16 KB

也就是说&＃xff0c;当需要从磁盘中读数据时每一次最少将从磁盘中读取16KB的内容到内存中&＃xff0c;每一次最少也会把内存中的16KB内容写到磁盘中

InnoDB数据页结构

每次InnoDB拿的页即数据页&＃xff0c;为16kb&＃xff0c;这16kb大小的存储空间可以被划分为多个部分&＃xff0c;示意图如下&＃xff1a;

名称

中文名

占用空间

简单描述

File Header

文件头部

38字节

页的一些通用信息

Page Header

页面头部

56字节

数据页专有的一些信息

Infimum &＃43; Supremum

最小记录和最大记录

26字节

两个虚拟的行记录

User Records

用户记录

不确定

实际存储的行记录内容

Free Space

空闲空间

不确定

页中尚未使用的空间

Page Directory

页面目录

不确定

页中的某些记录的相对位置

File Trailer

文件尾部

8字节

校验页是否完整

InnoDB 行格式

我们平时是以记录为单位向表中插入数据的&＃xff0c;这些记录在磁盘上的存放方式被称为行格式。

行格式分别是Compact、Redundant、Dynamic和Compressed行格式

Compact

记录的真实数据:

记录的真实数据除了我们自己定义的列的数据外,还加了隐藏列:

列名

是否必须

占用空间

描述

row_id

否

6字节

行id,唯一标识一条记录

transaction_id

是

6字节

事务id

roll_pointer

是

7字节

回滚指针

InnoDB对主键的生成策略

优先使用用户自定义主键作为主键,如果没定义,则选取一个unique键作为主键,如果没有定义unique键,则会为表默认添加一个row_id 作为主键.

行溢出

一页只能存16kb, 而一个varchar的类型的列最多就可以存65533个字节,这样就会造成一页存不了一条记录.

在Compact和Reduntant格式中, 记录真实数据数据处只会存储该列的一部分数据,把剩余的数据分散存储在其他几个页中,记录指向这些页的地址.

行格式除了记录真实数据外&＃xff0c;还会记录额外信息&＃xff1a;

变长字段长度列表

比如我们有varchar[varchar是可变长度的,所以占用空间不确定]　&＃xff0c;这里就会记录这个varchar对应的真实的长度

NULL值列表

把这行数据里是null的都记录下来. 具体就是将每个允许存储null的列对应一个二进制位,二进制位位1时,代表该列的值位null.

记录头信息

记录头信息用于描述记录,由固定的5个字节组成,即40个二进制位,不同的位代表不同的意思:

Dynamic和Compressed

Dynamic和Compressed类似于行格式, 只是处理行溢出不同,他们不会在记录的真实数据处存储一部分数据,而是把所有的数据都存储到其他页面,只有在记录的真实数据处存储其他页面的地址.

Compressed行格式会采用压缩算法对页面进行压缩.

索引

B&＃43; 树

我们把数据按下面的格式存,每个页面都按照索引列的值建立了页目录.

其实就是B&＃43;树:

上面的是模拟,InnoDB的做法:

当第一页满了以后,会把第一页复制一份,把原来的第一页作为页目录.

这样可以保证入口永远不变.

叶子结点存了所有排好序的数据

聚集索引和辅助索引

聚集索引

按照每个表的主键构造一颗B&＃43;树&＃xff0c;同时页节点存放的是整张表的行记录数据&＃xff0c;每一个叶子节点都被称为数据页。

聚集索引是逻辑上连续不是物理连续

聚集索引对于主键的排序查找和范围查找速度非常快

辅助索引

叶子节点并不包含记录的全部数据&＃xff0c;每个叶子节点中的索引行中存的不是这一行数据而是主键.

通过这个主键去找对应的行数据

建立索引

建立索引其实就是选择要排序的键, 按照我们选的键进行排序建立新的B&＃43;树

意思是用b c d 三个列来建立索引, 就是b的值相同就比较c 再比较d

create index idx_t1_bcd on t1(b,c,d)

索引的代价

空间上的代价

一个索引都为对应一棵B&＃43;树&＃xff0c;树中每一个节点都是一个数据页&＃xff0c;一个页默认会占用16KB的存储空间&＃xff0c;所以一个索引也是会占用磁盘空间的。

时间上的代价

每次对表中的数据进行增删改操作时,都要去修改各个B&＃43;树索引

推荐阅读

header
Python + Pytest 接口自动化测试中 Token 关联登录的实现方法

本文将深入探讨 Python 和 Pytest 在接口自动化测试中如何实现 Token 关联登录，内容详尽、逻辑清晰，旨在帮助读者掌握这一关键技能。 ... [详细]

蜡笔小新 2024-12-21 14:48:49
python
SaltStack部署实践（4）JOB管理与Returns模块

目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]

蜡笔小新 2024-12-22 18:53:43
header
解决C# Windows Forms客户端连接SignalR服务器时出现的错误

在尝试使用C# Windows Forms客户端通过SignalR连接到ASP.NET服务器时，遇到了内部服务器错误（500）。本文将详细探讨问题的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-21 16:55:52
header
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
triggers
优化DB2数据库性能的关键策略

本文详细介绍了优化DB2数据库性能的多种方法，涵盖统计信息更新、缓冲池调整、日志缓冲区配置、应用程序堆大小设置、排序堆参数调整、代理程序管理、锁机制优化、活动应用程序限制、页清除程序配置、I/O服务器数量设定以及编入组提交数调整等方面。通过这些技术手段，可以显著提升数据库的运行效率和响应速度。 ... [详细]

蜡笔小新 2024-12-22 16:20:33
version
Nginx 反向代理与负载均衡实验

本实验旨在通过配置 Nginx 实现反向代理和负载均衡，确保从北京本地代理服务器访问上海的 Web 服务器时，能够依次显示红、黄、绿三种颜色页面以验证负载均衡效果。 ... [详细]

蜡笔小新 2024-12-22 15:15:48
version
SQL数据库面试题解析

本文深入探讨了SQL数据库中常见的面试问题，包括如何获取自增字段的当前值、防止SQL注入的方法、游标的作用与使用、索引的形式及其优缺点，以及事务和存储过程的概念。通过详细的解答和示例，帮助读者更好地理解和应对这些技术问题。 ... [详细]

蜡笔小新 2024-12-22 14:43:35
require
使用Fetch进行HTTP请求的基本示例

本文介绍了如何使用JavaScript的Fetch API与Express服务器进行交互，涵盖了GET、POST、PUT和DELETE请求的实现，并展示了如何处理JSON响应。 ... [详细]

蜡笔小新 2024-12-22 12:55:37
header
探究同一请求在不同机器上返回不同HTTP状态码200和429的原因

本文探讨了为何相同的HTTP请求在两台不同操作系统（Windows与Ubuntu）的机器上会分别返回200 OK和429 Too Many Requests的状态码。我们将分析代码、环境差异及可能的影响因素。 ... [详细]

蜡笔小新 2024-12-21 19:35:11
dll
利用MySQL弱口令获取系统权限的实战案例

本文详细介绍了一种通过MySQL弱口令漏洞在Windows操作系统上获取SYSTEM权限的方法。该方法涉及使用自定义UDF DLL文件来执行任意命令，从而实现对远程服务器的完全控制。 ... [详细]

蜡笔小新 2024-12-21 18:17:57
header
深入解析ESFramework中的AgileTcp组件

本文详细介绍了ESFramework框架中AgileTcp组件的设计与实现。AgileTcp是ESFramework提供的ITcp接口的高效实现，旨在优化TCP通信的性能和结构清晰度。 ... [详细]

蜡笔小新 2024-12-21 13:56:06
version
ssm 框架整合及工程分层

ssm框架整合及工程分层1.先创建一个新的project1.1配置pom.xml ... [详细]

蜡笔小新 2024-12-21 12:56:58
version
深入解析MySQL中的七种JOIN查询

本文详细介绍了MySQL中常用的七种JOIN查询方法，包括内连接、左外连接、右外连接、全外连接以及排除连接等，并通过实例进行说明。 ... [详细]

蜡笔小新 2024-12-21 12:53:17
uri
phpMyAdmin 安装与配置详解

本文详细介绍了 phpMyAdmin 的安装与配置方法，适用于多个版本的 phpMyAdmin。通过本教程，您将掌握从下载到部署的完整流程，并了解如何根据不同的环境进行必要的配置调整。 ... [详细]

蜡笔小新 2024-12-21 11:54:31
header
SQL Server 中 INSERT 语句无法插入数据的问题分析与解决

本文探讨了在 SQL Server 中使用 JDBC 插入数据时遇到的问题。通过详细分析代码和数据库配置，提供了解决方案并解释了潜在的原因。 ... [详细]

蜡笔小新 2024-12-21 09:52:27

手机用户2602897795

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章