insertintoselect主键自增_为什么MySQL的自增主键不单调也不连续

作者：辣妈最___潮 | 来源：互联网 | 2024-09-29 14:38

为什么这么设计（Why’sTHEDesign）是一系列关于计算机领域中程序设计决策的文章，我们在这个系列的每一篇文章中都会提出一个具体的问

为什么这么设计&＃xff08;Why’s THE Design&＃xff09;是一系列关于计算机领域中程序设计决策的文章&＃xff0c;我们在这个系列的每一篇文章中都会提出一个具体的问题并从不同的角度讨论这种设计的优缺点、对具体实现造成的影响。如果你有想要了解的问题&＃xff0c;可以在文章下面留言。

当我们在使用关系型数据库时&＃xff0c;主键&＃xff08;Primary Key&＃xff09;是无法避开的概念&＃xff0c;主键的作用就是充当记录的标识符&＃xff0c;我们能够通过标识符在一张表中定位到唯一的记录&＃xff0c;作者在为什么总是需要无意义的 ID 曾经介绍过为什么不应该使用有意义的字段来充当唯一标识符&＃xff0c;感兴趣的读者可以了解一下。

在关系型数据库中&＃xff0c;我们会选择记录中多个字段的最小子集作为该记录在表中的唯一标识符1&＃xff0c;根据关系型数据库对主键的定义&＃xff0c;我们既可以选择单个列作为主键&＃xff0c;也可以选择多个列作为主键&＃xff0c;但是主键在整个记录中必须存在并且唯一。最常见的方式当然是使用 MySQL 默认的自增 ID 作为主键&＃xff0c;虽然使用其他策略设置的主键也是合法的&＃xff0c;但是不是通用的以及推荐的做法。

图 1 - MySQL 的主键

MySQL 中默认的 AUTO_INCREMENT 属性在多数情况下可以保证主键的连续性&＃xff0c;我们通过 show create table 命令可以在表的定义中能够看到 AUTO_INCREMENT 属性的当前值&＃xff0c;当我们向当前表中插入数据时&＃xff0c;它会使用该属性的值作为插入记录的主键&＃xff0c;而每次获取该值也都会将它加一。

CREATE

在很多开发者的认知中&＃xff0c;MySQL 的主键都应该是单调递增的&＃xff0c;但是在我们与 MySQL 打交道的过程中会遇到两个问题&＃xff0c;首先是记录的主键并不连续&＃xff0c;其次是可能会创建多个主键相同的记录&＃xff0c;我们将从以下的两个角度回答 MySQL 不单调和不连续的原因&＃xff1a;

较早版本的 MySQL 将 AUTO_INCREMENT 存储在内存中&＃xff0c;实例重启后会根据表中的数据重新设置该值&＃xff1b;
获取 AUTO_INCREMENT 时不会使用事务锁&＃xff0c;并发的插入事务可能出现部分字段冲突导致插入失败&＃xff1b;

需要注意的是&＃xff0c;我们在这篇文章中讨论的是 MySQL 中最常见的 InnoDB 存储引擎&＃xff0c;MyISAM 等其他引擎提供的 AUTO_INCREMENT 实现原理不在本文的讨论范围中。

删除记录

AUTO_INCREMENT 属性虽然在 MySQL 中十分常见&＃xff0c;但是在较早的 MySQL 版本中&＃xff0c;它的实现还比较简陋&＃xff0c;InnoDB 引擎会在内存中存储一个整数表示下一个被分配到的 ID&＃xff0c;当客户端向表中插入数据时会获取 AUTO_INCREMENT 值并将其加一。

图 2 - AUTO_INCREMENT 的使用

因为该值存储在内存中&＃xff0c;所以在每次 MySQL 实例重新启动后&＃xff0c;当客户端第一次向 table_name 表中插入记录时&＃xff0c;MySQL 会使用如下所示的 SQL 语句查找当前表中 id 的最大值&＃xff0c;将其加一后作为待插入记录的主键&＃xff0c;并作为当前表中 AUTO_INCREMENT 计数器的初始值2。

SELECT MAX(ai_col) FROM table_name FOR UPDATE;

如果让作者实现 AUTO_INCREMENT&＃xff0c;在最开始也会使用这种方法。不过这种实现虽然非常简单&＃xff0c;但是如果使用者不严格遵循关系型数据库的设计规范&＃xff0c;就会出现如下所示的数据不一致的问题&＃xff1a;

图 3 - 5.7 版本之前的 AUTO_INCMRENT

因为重启了 MySQL 的实例&＃xff0c;所以内存中的 AUTO_INCREMENT 计数器会被重置成表中的最大值&＃xff0c;当我们再向表中插入新的 trades 记录时会重新使用 10 作为主键&＃xff0c;主键也就不是单调的了。在新的 trades 记录插入之后&＃xff0c;executions 表中的记录就错误的引用了新的 trades&＃xff0c;这其实是一个比较严重的错误。

然而这也不完全是 MySQL 的问题&＃xff0c;如果我们严格遵循关系型数据库的设计规范&＃xff0c;使用外键处理不同表之间的联系&＃xff0c;就可以避免上述问题&＃xff0c;因为当前 trades 记录仍然有外部的引用&＃xff0c;所以外键会禁止 trades 记录的删除&＃xff0c;不过多数公司内部的 DBA 都不推荐或者禁止使用外键&＃xff0c;所以确实存在出现这种问题的可能。

然而在 MySQL 8.0 中&＃xff0c;AUTO_INCREMENT 计数器的初始化行为发生了改变&＃xff0c;每次计数器的变化都会写入到系统的重做日志&＃xff08;Redo log&＃xff09;并在每个检查点存储在引擎私有的系统表中3。

In MySQL 8.0, this behavior is changed. The current maximum auto-increment counter value is written to the redo log each time it changes and is saved to an engine-private system table on each checkpoint. These changes make the current maximum auto-increment counter value persistent across server restarts.

当 MySQL 服务被重启或者处于崩溃恢复时&＃xff0c;它可以从持久化的检查点和重做日志中恢复出最新的 AUTO_INCREMENT 计数器&＃xff0c;避免出现不单调的主键也解决了这里提到的问题。

并发事务

为了提高事务的吞吐量&＃xff0c;MySQL 可以处理并发执行的多个事务&＃xff0c;但是如果并发执行多个插入新记录的 SQL 语句&＃xff0c;可能会导致主键的不连续。如下图所示&＃xff0c;事务 1 向数据库中插入 id &＃61; 10 的记录&＃xff0c;事务 2 向数据库中插入 id &＃61; 11 和 id &＃61; 12 的两条记录&＃xff1a;

图 4 - 并发事务的执行

不过如果在最后事务 1 由于插入的记录发生了唯一键冲突导致了回滚&＃xff0c;而事务 2 没有发生错误而正常提交&＃xff0c;在这时我们会发现当前表中的主键出现了不连续的现象&＃xff0c;后续新插入的数据也不再会使用 10 作为记录的主键。

图 5 - 不连续的主键

这个现象背后的原因也很简单&＃xff0c;虽然在获取 AUTO_INCREMENT 时会加锁&＃xff0c;但是该锁是语句锁&＃xff0c;它的目的是保证 AUTO_INCREMENT 的获取不会导致线程竞争&＃xff0c;而不是保证 MySQL 中主键的连续4。

上述行为是由 InnoDB 存储引擎提供的 innodb_autoinc_lock_mode 配置控制的&＃xff0c;该配置决定了获取 AUTO_INCREMENT 计时器时需要先得到的锁&＃xff0c;该配置存在三种不同的模式&＃xff0c;分别是传统模式&＃xff08;Traditional&＃xff09;、连续模式&＃xff08;Consecutive&＃xff09;和交叉模式&＃xff08;Interleaved&＃xff09;5&＃xff0c;其中 MySQL 使用连续模式作为默认的锁模式&＃xff1a;

传统模式 innodb_autoinc_lock_mode &＃61; 0&＃xff1b;在包含 AUTO_INCREMENT 属性的表中插入数据时&＃xff0c;所有的 INSERT 语句都会获取表级别的 AUTO_INCREMENT 锁&＃xff0c;该锁会在当前语句执行后释放&＃xff1b;
连续模式 innodb_autoinc_lock_mode &＃61; 1&＃xff1b;INSERT ... SELECT、REPLACE ... SELECT 以及 LOAD DATA 等批量的插入操作需要获取表级别的 AUTO_INCREMENT 锁&＃xff0c;该锁会在当前语句执行后释放&＃xff1b;简单的插入语句&＃xff08;预先知道插入多少条记录的语句&＃xff09;只需要获取获取 AUTO_INCREMENT 计数器的互斥锁并在获取主键后直接释放&＃xff0c;不需要等待当前语句执行完成&＃xff1b;
交叉模式 innodb_autoinc_lock_mode &＃61; 2&＃xff1b;所有的插入语句都不需要获取表级别的 AUTO_INCREMENT 锁&＃xff0c;但是当多个语句插入的数据行数不确定时&＃xff0c;可能存在分配相同主键的风险&＃xff1b;

这三种模式都不能解决 MySQL 自增主键不连续的问题&＃xff0c;想要解决这个问题的终极方案是串行执行所有包含插入操作的事务&＃xff0c;也就是使用数据库的最高隔离级别 —— 可串行化&＃xff08;Serialiable&＃xff09;。当然直接修改数据库的隔离级别相对来说有些简单粗暴&＃xff0c;基于 MySQL 或者其他存储系统实现完全串行的插入也可以保证主键在插入时的连续&＃xff0c;但是仍然不能避免删除数据导致的不连续。

总结

早期 MySQL 的主键既不是单调的&＃xff0c;也不是连续的&＃xff0c;这些都是在当时工程上做出的一些选择&＃xff0c;如果严格地按照关系型数据库的设计规范&＃xff0c;MySQL 最初的设计造成问题的概率也比较低&＃xff0c;只有当被删除的主键被外部系统引用时才会影响数据的一致性&＃xff0c;但是今天使用方式的不同却增加出错的可能性&＃xff0c;而 MySQL 也在 8.0 中持久化了 AUTO_INCREMENT 以避免该问题的出现。

MySQL 中不连续的主键又是一个工程设计向性能低头的例子&＃xff0c;牺牲主键的连续性来支持数据的并发插入&＃xff0c;最终提高了 MySQL 服务的吞吐量&＃xff0c;作者在几年前刚刚使用 MySQL 时就遇到过这个问题&＃xff0c;但是当时并没有深究背后的原因&＃xff0c;今天重新理解该问题背后的设计决策也是个非常有趣的过程。我们在这里简单总结一下本文的内容&＃xff0c;重新回到今天的问题 — 为什么 MySQL 的自增主键不单调也不连续&＃xff1a;

MySQL 5.7 版本之前在内存中存储 AUTO_INCREMENT 计数器&＃xff0c;实例重启后会根据表中的数据重新设置&＃xff0c;在删除记录后重启就可能出现重复的主键&＃xff0c;该问题在 8.0 版本使用重做日志解决&＃xff0c;保证了主键的单调性&＃xff1b;
MySQL 插入数据获取 AUTO_INCREMENT 时不会使用事务锁&＃xff0c;而是会使用互斥锁&＃xff0c;并发的插入事务可能出现部分字段冲突导致插入失败&＃xff0c;想要保证主键的连续需要串行地执行插入语句&＃xff1b;

到最后&＃xff0c;我们还是来看一些比较开放的相关问题&＃xff0c;有兴趣的读者可以仔细思考一下下面的问题&＃xff1a;

MyISAM 和其他的存储引擎如何存储 AUTO_INCREMENT 计数器&＃xff1f;
MySQL 中的 auto_increment_increment 和 auto_increment_offset 是用来做什么的&＃xff1f;

原文链接&＃xff1a;https://www.toutiao.com/a6817982962324210183/

推荐阅读

list
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
fetch
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新 2024-12-28 12:22:34
get
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
list
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
go
MyBatis：深入解析与应用

在当前众多持久层框架中，MyBatis（前身为iBatis）凭借其轻量级、易用性和对SQL的直接支持，成为许多开发者的首选。本文将详细探讨MyBatis的核心概念、设计理念及其优势。 ... [详细]

蜡笔小新 2024-12-27 12:17:16
main
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
fetch
SQL数据库管理系统（DBMS）中常见函数的差异与应用

本文详细探讨了不同SQL数据库管理系统（DBMS）在限制输出结果、拼接字段和日期时间处理方面的函数差异。通过具体示例，帮助读者理解并掌握如何在不同DBMS中实现相同功能。 ... [详细]

蜡笔小新 2024-12-28 13:26:49
string
Windows服务与数据库交互问题解析

本文探讨了在Windows 10（64位）环境下开发的Windows服务，旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行，但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-28 10:30:14
string
SQL中UPDATE SET FROM语句的使用方法及应用场景

本文详细介绍了SQL中UPDATE SET FROM语句的使用方法，通过具体示例展示了如何利用该语句高效地更新多表关联数据。适合数据库管理员和开发人员参考。 ... [详细]

蜡笔小新 2024-12-28 10:22:16
string
使用C#开发SQL Server存储过程的指南

本文介绍如何利用C#在SQL Server中创建存储过程，涵盖背景、步骤和应用场景，旨在帮助开发者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-12-27 14:24:17
string
MySQL数据库安装指南

本文详细介绍如何下载并安装MySQL数据库（5.7.10版本），以及配置Navicat管理工具（免费版）。通过本指南，您将了解从下载到安装的完整流程，并掌握基本的数据库管理技能。 ... [详细]

蜡笔小新 2024-12-27 10:53:40
get
在 Linux 系统中部署 PostgreSQL 数据库

本文详细介绍了如何在 Linux 平台上安装和配置 PostgreSQL 数据库。通过访问官方资源并遵循特定的操作步骤，用户可以在不同发行版（如 Ubuntu 和 Red Hat）上顺利完成 PostgreSQL 的安装。 ... [详细]

蜡笔小新 2024-12-27 03:46:27
main
使用 SQLiteJDBC 和 HikariCP 实现 Java 程序连接 SQLite 数据库

本文介绍了如何通过 Maven 依赖引入 SQLiteJDBC 和 HikariCP 包，从而在 Java 应用中高效地连接和操作 SQLite 数据库。文章提供了详细的代码示例，并解释了每个步骤的实现细节。 ... [详细]

蜡笔小新 2024-12-26 17:34:42
list
使用Vultr云服务器和Namesilo域名搭建个人网站

本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站，包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南，帮助读者顺利完成建站过程。 ... [详细]

蜡笔小新 2024-12-26 16:36:34
select
SQL 触发器实现视图插入操作

本文介绍如何通过创建替代插入触发器，使对视图的插入操作能够正确更新相关的基本表。涉及的表包括：飞机（Aircraft）、员工（Employee）和认证（Certification）。 ... [详细]

蜡笔小新 2024-12-26 15:53:40

辣妈最___潮

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章