MYSQLcrashrecovery

作者：海木木 | 来源：互联网 | 2023-08-13 13:09

为什么需要crashrecovery如果数据库是非正常模式退出（如kill-9等），这会导致的问题是磁盘上的页面状态与redolog的内容不一致，因为bufferpool中的pag

为什么需要crash recovery

如果数据库是非正常模式退出（如kill -9等），这会导致的问题是磁盘上的页面状态与redo log的内容不一致，因为buffer pool中的page内容是异步刷脏至磁盘上，而这就需要我们在启动时将两者恢复到一致状态。

除了要将磁盘页面恢复到一个一致状态以外，还需要考虑到退出时的活跃事务处理：哪些事务需要提交，哪些事务需要回滚等等，这些也属于crash recovery的工作职责。

如何crash recovery

crash recovery的第一阶段是回放redo log以将磁盘上的数据页面恢复至最新状态，而回放的起始位点就是实例退出前记录的checkpoint lsn。因为checkpoint lsn保证了这之前的redo log对应的page更改一定已经被持久化。

在完成第一阶段后，接下来就是恢复逻辑状态，即处理那些未决事务。

接下来按照阶段分别描述其具体实现。

回放redo log

该阶段会首先读取checkpoint lsn，然后从此处开始扫描redo log至末尾，解析这些redo log，将它们加入至一个hash table中，然后回放这些redo log。

读取checkpoint

dberr_t
recv_recovery_from_checkpoint_start(
lsn_t flush_lsn)
{
err = recv_find_max_checkpoint(&max_cp_group, &max_cp_field);

log_group_header_read(max_cp_field);

buf = log_sys->checkpoint_buf;

checkpoint_lsn = mach_read_from_8(buf + LOG_CHECKPOINT_LSN);
checkpoint_no = mach_read_from_8(buf + LOG_CHECKPOINT_NO);
}

读取并解析redo log

static void
recv_recovery_begin(log_t &log, lsn_t *contiguous_lsn)
{
// 情况存放redo log的hash table
recv_sys_empty_hash();
...
while (!finished) {
// 批量读取redo log(64KB),然后解析redo log并放入hash table
lsn_t end_lsn = start_lsn + RECV_SCAN_SIZE;
recv_read_log_seg(log, log.buf, start_lsn, end_lsn);
finished = recv_scan_log_recs(log, max_mem, log.buf, RECV_SCAN_SIZE,
checkpoint_lsn, start_lsn, contiguous_lsn,
&log.scanned_lsn);

start_lsn = end_lsn;
}
}

而读取、解析redo log的实现全部位于函数 recv_scan_log_recs()
中，这个函数比较冗长：

bool
recv_scan_log_recs(...)
{
// 按照block扫描redo log并将其有效内容加入至parse buffer(recv_sys->buf)
do {
data_len = log_block_get_data_len(log_block);

scanned_lsn += data_len;

if (scanned_lsn > recv_sys->scanned_lsn) {
more_data = recv_sys_add_to_parsing_buf(
log_block, scanned_lsn);
recv_sys->scanned_lsn = scanned_lsn;
recv_sys->scanned_checkpoint_no
= log_block_get_checkpoint_no(log_block);
}
...
} while (log_block
// 开始解析parse buffer内的redo log
if (more_data && !recv_sys->found_corrupt_log) {
if (recv_parse_log_recs(checkpoint_lsn)) {
...
}
}
}

static void
recv_parse_log_recs(lsn_t checkpoint_lsn)
{
for (;;) {
byte *ptr = recv_sys->buf + recv_sys->recovered_offset;

byte *end_ptr = recv_sys->buf + recv_sys->len;

bool single_rec = !!(*ptr & MLOG_SINGLE_REC_FLAG);

// 分别解析single和multi类型redo log
if (single_rec) {
if (recv_single_rec(ptr, end_ptr)) {
return;
}
} else if (recv_multi_rec(ptr, end_ptr)) {
return;
}
}
}

无论是single还是multi redo log record，解析出log的type和body等信息后都会通过recv_add_to_hash_table将其插入至全局的hash table中。 recv_add_to_hash_table
的原理也比较简单，recv_sys对象内存在一个hash table，根据redo log的计算hash值并插入至hash table中即可。这里就不再罗列代码。

至此，所有需要回放的redo log都已经被添加至hash table，接下来就是回放这些redo log。

回放redo log

dberr_t
srv_start(bool create_new_db, const std::string &scan_directories)
{
...
err = recv_recovery_from_checkpoint_start(*log_sys, flushed_lsn);
...
if (srv_force_recovery recv_apply_hashed_log_recs(*log_sys, true);
}
...
}

void
recv_apply_hashed_log_recs(log_t &log, bool allow_ibuf)
{
for (const auto &space : *recv_sys->spaces) {
for (auto pages : space.second.m_pages) {
recv_apply_log_rec(pages.second);
}
}
}

回放的逻辑也比较简单，扫描之前构建的hash table内的每一个redo log，读取该redo log对应的page，然后根据redo log类型将其日志在物理页面上执行一遍，这里就不再赘述代码，详细可参考函数 recv_parse_or_apply_log_rec_body
。

推荐阅读

utf-8
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
instance
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
eval
开发日志：高效图片压缩与上传技术解析

开发日志：高效图片压缩与上传技术解析 ... [详细]

蜡笔小新 2024-11-11 19:33:51
int
PTArchiver工作原理详解与应用分析

PTArchiver工作原理及其应用分析本文详细解析了PTArchiver的工作机制，探讨了其在数据归档和管理中的应用。PTArchiver通过高效的压缩算法和灵活的存储策略，实现了对大规模数据的高效管理和长期保存。文章还介绍了其在企业级数据备份、历史数据迁移等场景中的实际应用案例，为用户提供了实用的操作建议和技术支持。 ... [详细]

蜡笔小新 2024-11-11 13:40:49
shell
服务器部署中的安全策略实践与优化

服务器部署中的安全策略实践与优化 ... [详细]

蜡笔小新 2024-11-10 13:04:30
shell
使用Shell脚本高效部署MHA高可用集群

本文介绍了如何利用Shell脚本高效地部署MHA（MySQL High Availability）高可用集群。通过详细的脚本编写和配置示例，展示了自动化部署过程中的关键步骤和注意事项。该方法不仅简化了集群的部署流程，还提高了系统的稳定性和可用性。 ... [详细]

蜡笔小新 2024-11-10 10:15:46
shell
如何通过登录PHP网站实现校园内外差异化访问：内部免费而外部需付费

该大学网站采用PHP和MySQL技术，在校内可免费访问某些外部收费资料数据库。为了方便学生校外访问，建议通过学校账号登录实现免费访问。具体方案可包括利用学校服务器作为代理，结合身份验证机制，确保合法用户在校外也能享受免费资源。 ... [详细]

蜡笔小新 2024-11-10 03:11:33
grid
深入解析NoSQL数据库：键值对、文档、列式存储与图数据库的应用与特点

本文深入探讨了NoSQL数据库的四大主要类型：键值对存储、文档存储、列式存储和图数据库。NoSQL（Not Only SQL）是指一系列非关系型数据库系统，它们不依赖于固定模式的数据存储方式，能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构；文档存储支持复杂的数据对象；列式存储优化了大数据量的读写性能；而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景，本文将详细分析它们的特点及应用实例。 ... [详细]

蜡笔小新 2024-11-09 14:47:28
process
如何优化MySQL数据库性能以提升查询效率和系统稳定性

如何优化MySQL数据库性能以提升查询效率和系统稳定性 ... [详细]

蜡笔小新 2024-11-09 13:48:51
utf-8
使用Maven JAR插件将单个或多个文件及其依赖项合并为一个可引用的JAR包

本文介绍了如何利用Maven中的maven-assembly-plugin插件将单个或多个Java文件及其依赖项打包成一个可引用的JAR文件。首先，需要创建一个新的Maven项目，并将待打包的Java文件复制到该项目中。通过配置maven-assembly-plugin，可以实现将所有文件及其依赖项合并为一个独立的JAR包，方便在其他项目中引用和使用。此外，该方法还支持自定义装配描述符，以满足不同场景下的需求。 ... [详细]

蜡笔小新 2024-11-09 01:59:29
blob
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
blob
在Linux系统上彻底卸载Zimbra邮件系统

本文详细介绍了如何在Linux系统（以CentOS为例）上彻底卸载Zimbra邮件系统，包括停止服务、删除文件和用户等步骤。 ... [详细]

蜡笔小新 2024-11-13 14:32:16
jsp
Java DAO模式详解与代码示例

DAO（Data Access Object）模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法，它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]

蜡笔小新 2024-11-13 12:25:33
eval
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
eval
如何有效规避以root用户运行MySQL的潜在安全威胁

MySQL作为一款广泛使用的关系型数据库管理系统，在实际应用中，许多用户习惯于使用root账户进行操作，但这会带来显著的安全隐患。本文将详细探讨如何通过创建专用账户和实施严格的权限管理，有效规避以root用户运行MySQL所带来的潜在安全威胁。同时，文章还将提供一系列最佳实践，帮助用户增强数据库的整体安全性。 ... [详细]

蜡笔小新 2024-11-10 12:00:44

海木木

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章