作者:caozhengweile_854 | 来源:互联网 | 2023-09-13 09:40
经常会遇到操作一张大表,发现操作时间过长或影响在线业务,想要回退大表操作的场景。在停止大表操作之后,等待回滚是一个很漫长的过程,尽管可能对知道一些缩短时间的方法,处于对生产环境数据完整性的敬畏,也会选择不做介入。
事务回滚
事务是关系型数据库里的执行单位,可以通过最后阶段控制选择提交或回滚。在各种无法保证完整性的场景下进行回滚操作。MySQL里回滚是通过Undo日志完成,Undo日志记录包含关于如何撤消事务相关的最新更改的信息。Undo日志存在于Undo日志段中,Undo日志段包含在回滚段中。回滚段位于undo表空间和全局Temporary表空间中。
关系如下:
- undo文件
mysql > show variables like '%undo%';
+
| Variable_name | Value |
+
| innodb_max_undo_log_size | 1073741824 |
| innodb_undo_directory | /opt/data8.0/mysql |
| innodb_undo_log_encrypt | OFF |
| innodb_undo_log_truncate | ON |
| innodb_undo_tablespaces | 2 |
+
5 rows in set (0.00 sec)
- 全局Temporary所指的一个临时表空间(ibtmp1),用于存储对用户创建的临时表所做更改的回滚段。
mysql > SELECT @@innodb_temp_data_file_path;
+
| @@innodb_temp_data_file_path |
+
| ibtmp1:128M:autoextend:max:30G |
+
理解了回滚包含的文件都有那些 ,继续往下看。
回滚机制:
MySQL回滚控制是内部innodb引擎协调解决,不提供人为控制的机制。目前提供的MySQL回滚参数如下:
mysql> SHOW VARIABLES LIKE '%ROLL%';
+
| Variable_name | Value |
+
| innodb_rollback_on_timeout | OFF |
| innodb_rollback_segments | 128 |
+
innodb_rollback_on_timeout:
InnoDB默认只在事务超时时回滚最后一条语句。如果指定了——InnoDB -rollback-on-timeout,事务超时将导致InnoDB中止并回滚整个事务。默认下是关闭的,一旦指定时间,如回滚失败。可以想象到数据会存在不一致的问题。这个方式不可取。
Innodb_rollback_segments(1~128):
定义了分配给每个undo表空间的回滚段的数量,以及为生成undo记录的事务分配的全局临时表空间的数量。
回滚段支持的事务数量:取决于回滚段中的撤销slot数量以及每个事务所需的撤销日志数量
官方提供的回滚段中undo槽的数量根据InnoDB页面大小有关:
从最新的MySQL8.0.27源码实现中 storage\innobase\include\trx0rseg.h:
/* Number of undo log slots in a rollback segment file copy
这里 UNIV_PAGE_SIZE正常页面的大小 即 1024*/
#define TRX_RSEG_N_SLOTS (UNIV_PAGE_SIZE / 16)
/* Maximum number of transactions supported by a single rollback segment
单个回滚段支持的最大事务数1024/2=512
*/
#define TRX_RSEG_MAX_N_TRXS (TRX_RSEG_N_SLOTS / 2)
在默认情况下page中又划分了1024个slot槽(TRX_RSEG_N_SLOTS),每个slot又对应到一个undo log对象,因此理论上InnoDB可以支持 128 * 512=65536个普通事务。
原理部分参考MySQL · 引擎特性 · InnoDB undo log 漫游
官方提供undbo回滚并发读写场景:
从上诉的原理中回到实际应用场景中:
对于回滚段支持的能力,还是可观的,但往往执行大批量的回滚的时候非常慢。特别是在线处理过程中发现10w行回滚 有可能10分钟这样的情况。甚至更长时间。
下面通过sysbench准备5000w的单表数据,在无负载下,大概删除1分钟,之后通过kill -9,强制停止方式回滚事务:
明显重新启动效果更加。
但kill -9 方式容易把数据页损坏,存在很大的风险。日常当中数据库也有负载,可想而知,大事务回滚的代价非常大。
总结
应尽量避免大的回退操作,非常消耗数据库资源和性能,生产环境下会导致重大生产事故。避免不了大事务回滚,可以采取以下方式:
- 对于批量操作,可以分批提交 比如1000行 ~5000行之类的
- undo空间和全局临时表空间 可以适当的调整。建议4个undo文件,全局ibtmp1初始化1G
- 高可用环境下,能确数据的一致性下,可以把从提升新主,提供服务,等待大事务回滚。
- 极端情况下,可以通过 kill -9 重启操作会因为数据量非常大,导致mysql恢复缓慢,此时需要等待mysql进行崩溃恢复,根据数据量的不同,等待的时间也不同
- 如重新启动过程中,存在数据页损坏或跳过回滚 ,可通过innodb_force_recovery=3(不执行事务回滚操作。)