热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

MYSQLcrashrecovery

为什么需要crashrecovery如果数据库是非正常模式退出(如kill-9等),这会导致的问题是磁盘上的页面状态与redolog的内容不一致,因为bufferpool中的pag




为什么需要crash recovery


如果数据库是非正常模式退出(如kill -9等),这会导致的问题是磁盘上的页面状态与redo log的内容不一致,因为buffer pool中的page内容是异步刷脏至磁盘上,而这就需要我们在启动时将两者恢复到一致状态。


除了要将磁盘页面恢复到一个一致状态以外,还需要考虑到退出时的活跃事务处理:哪些事务需要提交,哪些事务需要回滚等等,这些也属于crash recovery的工作职责。



如何crash recovery


crash recovery的第一阶段是回放redo log以将磁盘上的数据页面恢复至最新状态,而回放的起始位点就是实例退出前记录的checkpoint lsn。因为checkpoint lsn保证了这之前的redo log对应的page更改一定已经被持久化。


在完成第一阶段后,接下来就是恢复逻辑状态,即处理那些未决事务。


接下来按照阶段分别描述其具体实现。



回放redo log


该阶段会首先读取checkpoint lsn,然后从此处开始扫描redo log至末尾,解析这些redo log,将它们加入至一个hash table中,然后回放这些redo log。



读取checkpoint


dberr_t
recv_recovery_from_checkpoint_start(
lsn_t flush_lsn)
{
err = recv_find_max_checkpoint(&max_cp_group, &max_cp_field);

log_group_header_read(max_cp_field);

buf = log_sys->checkpoint_buf;

checkpoint_lsn = mach_read_from_8(buf + LOG_CHECKPOINT_LSN);
checkpoint_no = mach_read_from_8(buf + LOG_CHECKPOINT_NO);
}


读取并解析redo log


static void
recv_recovery_begin(log_t &log, lsn_t *contiguous_lsn)
{
// 情况存放redo log的hash table
recv_sys_empty_hash();
...
while (!finished) {
// 批量读取redo log(64KB),然后解析redo log并放入hash table
lsn_t end_lsn = start_lsn + RECV_SCAN_SIZE;
recv_read_log_seg(log, log.buf, start_lsn, end_lsn);
finished = recv_scan_log_recs(log, max_mem, log.buf, RECV_SCAN_SIZE,
checkpoint_lsn, start_lsn, contiguous_lsn,
&log.scanned_lsn);

start_lsn = end_lsn;
}
}


而读取、解析redo log的实现全部位于函数 recv_scan_log_recs()
中,这个函数比较冗长:


bool
recv_scan_log_recs(...)
{
// 按照block扫描redo log并将其有效内容加入至parse buffer(recv_sys->buf)
do {
data_len = log_block_get_data_len(log_block);

scanned_lsn += data_len;

if (scanned_lsn > recv_sys->scanned_lsn) {
more_data = recv_sys_add_to_parsing_buf(
log_block, scanned_lsn);
recv_sys->scanned_lsn = scanned_lsn;
recv_sys->scanned_checkpoint_no
= log_block_get_checkpoint_no(log_block);
}
...
} while (log_block
// 开始解析parse buffer内的redo log
if (more_data && !recv_sys->found_corrupt_log) {
if (recv_parse_log_recs(checkpoint_lsn)) {
...
}
}
}

static void
recv_parse_log_recs(lsn_t checkpoint_lsn)
{
for (;;) {
byte *ptr = recv_sys->buf + recv_sys->recovered_offset;

byte *end_ptr = recv_sys->buf + recv_sys->len;

bool single_rec = !!(*ptr & MLOG_SINGLE_REC_FLAG);

// 分别解析single和multi类型redo log
if (single_rec) {
if (recv_single_rec(ptr, end_ptr)) {
return;
}
} else if (recv_multi_rec(ptr, end_ptr)) {
return;
}
}
}


无论是single还是multi redo log record,解析出log的type和body等信息后都会通过recv_add_to_hash_table将其插入至全局的hash table中。 recv_add_to_hash_table
的原理也比较简单,recv_sys对象内存在一个hash table,根据redo log的计算hash值并插入至hash table中即可。这里就不再罗列代码。


至此,所有需要回放的redo log都已经被添加至hash table,接下来就是回放这些redo log。



回放redo log


dberr_t
srv_start(bool create_new_db, const std::string &scan_directories)
{
...
err = recv_recovery_from_checkpoint_start(*log_sys, flushed_lsn);
...
if (srv_force_recovery recv_apply_hashed_log_recs(*log_sys, true);
}
...
}

void
recv_apply_hashed_log_recs(log_t &log, bool allow_ibuf)
{
for (const auto &space : *recv_sys->spaces) {
for (auto pages : space.second.m_pages) {
recv_apply_log_rec(pages.second);
}
}
}


回放的逻辑也比较简单,扫描之前构建的hash table内的每一个redo log,读取该redo log对应的page,然后根据redo log类型将其日志在物理页面上执行一遍,这里就不再赘述代码,详细可参考函数 recv_parse_or_apply_log_rec_body





推荐阅读
  • 本文介绍了深入浅出Linux设备驱动编程的重要性,以及两种加载和删除Linux内核模块的方法。通过一个内核模块的例子,展示了模块的编译和加载过程,并讨论了模块对内核大小的控制。深入理解Linux设备驱动编程对于开发者来说非常重要。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • JDK源码学习之HashTable(附带面试题)的学习笔记
    本文介绍了JDK源码学习之HashTable(附带面试题)的学习笔记,包括HashTable的定义、数据类型、与HashMap的关系和区别。文章提供了干货,并附带了其他相关主题的学习笔记。 ... [详细]
  • 本文讨论了在VMWARE5.1的虚拟服务器Windows Server 2008R2上安装oracle 10g客户端时出现的问题,并提供了解决方法。错误日志显示了异常访问违例,通过分析日志中的问题帧,找到了解决问题的线索。文章详细介绍了解决方法,帮助读者顺利安装oracle 10g客户端。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • PHP中的单例模式与静态变量的区别及使用方法
    本文介绍了PHP中的单例模式与静态变量的区别及使用方法。在PHP中,静态变量的存活周期仅仅是每次PHP的会话周期,与Java、C++不同。静态变量在PHP中的作用域仅限于当前文件内,在函数或类中可以传递变量。本文还通过示例代码解释了静态变量在函数和类中的使用方法,并说明了静态变量的生命周期与结构体的生命周期相关联。同时,本文还介绍了静态变量在类中的使用方法,并通过示例代码展示了如何在类中使用静态变量。 ... [详细]
  • 个人学习使用:谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]
  • 开发笔记:Java是如何读取和写入浏览器Cookies的
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了Java是如何读取和写入浏览器Cookies的相关的知识,希望对你有一定的参考价值。首先我 ... [详细]
  • Java中包装类的设计原因以及操作方法
    本文主要介绍了Java中设计包装类的原因以及操作方法。在Java中,除了对象类型,还有八大基本类型,为了将基本类型转换成对象,Java引入了包装类。文章通过介绍包装类的定义和实现,解答了为什么需要包装类的问题,并提供了简单易用的操作方法。通过本文的学习,读者可以更好地理解和应用Java中的包装类。 ... [详细]
  • Java自带的观察者模式及实现方法详解
    本文介绍了Java自带的观察者模式,包括Observer和Observable对象的定义和使用方法。通过添加观察者和设置内部标志位,当被观察者中的事件发生变化时,通知观察者对象并执行相应的操作。实现观察者模式非常简单,只需继承Observable类和实现Observer接口即可。详情请参考Java官方api文档。 ... [详细]
  • 先看官方文档TheJavaTutorialshavebeenwrittenforJDK8.Examplesandpracticesdescribedinthispagedontta ... [详细]
  • 模板引擎StringTemplate的使用方法和特点
    本文介绍了模板引擎StringTemplate的使用方法和特点,包括强制Model和View的分离、Lazy-Evaluation、Recursive enable等。同时,还介绍了StringTemplate语法中的属性和普通字符的使用方法,并提供了向模板填充属性的示例代码。 ... [详细]
  • 本文介绍了Swing组件的用法,重点讲解了图标接口的定义和创建方法。图标接口用来将图标与各种组件相关联,可以是简单的绘画或使用磁盘上的GIF格式图像。文章详细介绍了图标接口的属性和绘制方法,并给出了一个菱形图标的实现示例。该示例可以配置图标的尺寸、颜色和填充状态。 ... [详细]
  • 纠正网上的错误:自定义一个类叫java.lang.System/String的方法
    本文纠正了网上关于自定义一个类叫java.lang.System/String的错误答案,并详细解释了为什么这种方法是错误的。作者指出,虽然双亲委托机制确实可以阻止自定义的System类被加载,但通过自定义一个特殊的类加载器,可以绕过双亲委托机制,达到自定义System类的目的。作者呼吁读者对网上的内容持怀疑态度,并带着问题来阅读文章。 ... [详细]
  • GreenDAO快速入门
    前言之前在自己做项目的时候,用到了GreenDAO数据库,其实对于数据库辅助工具库从OrmLite,到litePal再到GreenDAO,总是在不停的切换,但是没有真正去了解他们的 ... [详细]
author-avatar
海木木
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有