作者:你给的未来丶我不要 | 来源:互联网 | 2023-09-06 13:11
原文:http://dinglin.iteye.com/blog/1174780
前天同事问了个问题,今天又再翻了下group commit。关于这个话题Kristian Nielsen有一个很详尽的系列文章(http://kristiannielsen.livejournal.com/12254.html), 有四个页面,文中有链接。这里列出一些细节,主要是对上面文章补充一下。
Q:什么是group commit。
A:1) 简单说就是:好几个线程写文件,然后一个线程fsync;
2) 只有事务日志(ib_logfile)用到;
3) 注意是多个线程(多用户)。一个线程在一个事务过程中若出现多次写事务日志,是不能一起提交的。
Q: 既然是多个线程,那怎么决定由哪个线程去”commit”
A:其实每个线程都会试着去fsync。成功fsync之后线程会修改log_sys->written_to_all_lsn。 另外一个线程在fsync之前若判断log_sys->written_to_all_lsn大于自己的lsn,说明自己要作的事儿已经被别的线程做掉了,直接返回(group commit获益)。
Q:group commit怎么保证事务日志顺序和bin-log顺序一致。
A:这个问题是在Kristian Nielsen那篇文章中纠结最多的。目前的做法,是在写binlog前的prepare阶段加了个锁,这个锁直到binlog写完,然后将新的binlog位置填到trx->mysql_log_offset才解开。因此两个日志上的事务顺序是保证一致的。
在这个机制下,binlog是无法实现group commit的,所以直到最新的5.6版本中的log_xid函数的注释中依旧写着”todo: group commit”。
(补充说明:Percona 5.5.18版本以后已经有binlog group commit的功能)