当前位置: 开发笔记 > 编程语言 > 正文

线上MySQL读写分离，出现写完读不到问题如何解决？

作者：假爱多慌乱 | 来源：互联网 | 2023-09-18 18:56

今天我们来详细了解一下主从同步延迟时读写分离发生写后读不到的问题，依次讲解问题出现的原因，解决策略以及Sharding-jdbc、MyCat和MaxSc

今天我们来详细了解一下主从同步延迟时读写分离发生写后读不到的问题&＃xff0c;依次讲解问题出现的原因&＃xff0c;解决策略以及 Sharding-jdbc、MyCat 和 MaxScale 等开源数据库中间件具体的实现方案。

一、写后读不到问题
MySQL 经典的一主两从三节点架构是大多数创业公司初期使用的主流数据存储方案之一&＃xff0c;主节点处理写操作&＃xff0c;两个从节点处理读操作&＃xff0c;分摊了主库的压力。
但是&＃xff0c;有时候可能会遇到执行完写操作后&＃xff0c;立刻去读发现读不到或者读到旧状态的尴尬场景。这是由于主从同步可能存在延迟&＃xff0c;在主节点执行完写操作&＃xff0c;再去从节点执行读操作&＃xff0c;读取了之前旧的状态。
上图展示了此类问题出现的操作顺序示意图&＃xff1a;
客户端首先通过代理向主节点 Master 进行了写入操作
紧接着第二步去从节点 Slave A 执行读操作&＃xff0c;此时 Master 和 Slave A 之间的同步还未完成&＃xff0c;所以第二步的读操作读取到了旧状态
当第五步再次进行读操作时&＃xff0c;此时同步已经完成&＃xff0c;所以可以从 Slave B 中读取到正确的状态。
下面&＃xff0c;我们就来看一下为什么会出现此类问题。

二、MySQL 主从同步
理解问题背后发生的原因&＃xff0c;才能更好的解决问题。MySQL 主从复制的过程大致如下图所示&＃xff0c;本篇文章只讲解同步过程中的流程&＃xff0c;建立同步连接和失联重传不是重点&＃xff0c;暂不讲解&＃xff0c;感兴趣的同学可以自行了解。
MySQL 主从复制&＃xff0c;涉及主从两个节点&＃xff0c;一共四个四个线程参与其中&＃xff1a;
主节点的 Client Thread&＃xff0c;处理客户端请求的线程&＃xff0c;执行如图所示的1~5步骤&＃xff0c;2&＃xff0c;3&＃xff0c;4步骤是为了保证数据的一致性和尽量减少丢失&＃xff0c;第三步骤时会通知 Dump Thread&＃xff1b;
主节点的 Dump Thread&＃xff0c;接收到 Client Thread 通知后&＃xff0c;负责读取本地的 binlog 的数据&＃xff0c;将 binlog 数据&＃xff0c;binlog 文件名以及当前发送 binlog 的位置信息发送给从节点&＃xff1b;
从节点的 IO Thread 负责接收 Dump Thread 发送的 binlog 数据和相关位置信息&＃xff0c;将其追加到本地的 relay log 等文件中&＃xff1b;
从节点的 SQL Thread 检测到 relay log 追加了新数据&＃xff0c;则解析其内容(其实就是解析 binlog 文件的内容)为可以执行的 SQL 语句&＃xff0c;然后在本地数据执行&＃xff0c;并记录下当前执行的 relay log 位置。
上述是默认的异步同步模式&＃xff0c;我们发现&＃xff0c;从主节点提交成功到从节点同步完成&＃xff0c;中间间隔了6&＃xff0c;7&＃xff0c;8&＃xff0c;9&＃xff0c;10多个步骤&＃xff0c;涉及到一次网络传输&＃xff0c;多次文件读取和写入的磁盘 IO 操作&＃xff0c;以及最后的 SQL 执行的 CPU 操作。
所以&＃xff0c;当主从节点间网络传输出现问题&＃xff0c;或者从节点性能较低时&＃xff0c;主从节点间的同步就会出现延迟&＃xff0c;导致文章一开始提及的写后读不到的问题。在高并发场景&＃xff0c;从节点一般要过几十毫秒&＃xff0c;甚至几百毫秒才能读到最新的状态。

三、常见的解决策略
一般来讲&＃xff0c;大致有如下方案解决写后读不出问题&＃xff1a;
强制走主库
判断主备无延迟
等主库位点或 GTID 方案
强制走主库
强制走主库方案最容易理解和实现&＃xff0c;它也是最常用的方案。顾名思义&＃xff0c;它就是强制让部分必须要读到最新状态的读操作去主节点执行&＃xff0c;这样就不会出现写后读不出问题。这种方案问题在于将一部分读压力给了主节点&＃xff0c;部分破化了读写分离的目的&＃xff0c;降低了整个系统的扩展性。
一般主流的数据库中间件都提供了强制走主库的机制&＃xff0c;比如&＃xff0c;在 sharding-jdbc 中&＃xff0c;可以使用 Hint 来强制路由主库。
`HintManager hintManager &＃61; HintManager.getInstance(); hintManager.setMasterRouteOnly(); // 继续JDBC操作`
它的原理就是在 SQL 语句前添加 Hint&＃xff0c;然后数据库中间件会识别出 Hint&＃xff0c;将其路由到主节点。
下面&＃xff0c;我们就来看一下如果要去从库查询&＃xff0c;并且要避免过期读的方案&＃xff0c;并分析各个方案的优缺点。
判断主备无延迟
第二种方案是使用 show slave status 语句结果中的部分值来判断主从同步的延迟时间&＃xff1a;
`>showslavestatus1.rowMaster_Log_File:mysql-bin.001822Read_Master_Log_Pos:290072815Seconds_Behind_Master:2923Relay_Master_Log_File:mysql-bin.001821Exec_Master_Log_Pos:256529431Auto_Position:0Retrieved_Gtid_Set:Executed_Gtid_Set:.....`
seconds_behind_master&＃xff0c;表示落后主节点秒数&＃xff0c;如果此值为0&＃xff0c;则表示主从无延迟
Master_Log_File 和 Read_Master_Log_Pos&＃xff0c;表示的是读到的主库的最新位点&＃xff0c;Relay_Master_Log_File 和 Exec_Master_Log_Pos&＃xff0c;表示的是备库执行的最新位点。如果这两组值相等&＃xff0c;则表示主从无延迟
Auto_Position&＃61;1 &＃xff0c;表示使用了 GTID 协议&＃xff0c;并且备库收到的所有日志的 GTID 集合 Retrieved_Gtid_Set 和执行完成的 GTID 集合 Executed_Gtid_Set 相等&＃xff0c;则表示主从无延迟。
在进行读操作前&＃xff0c;先根据上述方式来判断主从是否有延迟&＃xff0c;如果有延迟&＃xff0c;则一直等待到无延迟后执行。但是这类方案在判断是否有延迟时存在着假阳和假阴的问题&＃xff1a;
判断无延迟&＃xff0c;其他延迟了。因为上述判断是基于从节点的状态&＃xff0c;当主节点的 Dump Thread 尚未将最新状态发送给从节点的 IO SQL 时&＃xff0c;从节点可能会错误的判断自己和主节点无延迟。
判断有延迟&＃xff0c;但是读操作读取的最新状态已经同步。因为 MySQL 主从复制是一直在进行的&＃xff0c;写后直接读的同时可能还有其他无关写操作&＃xff0c;虽然主从有延迟&＃xff0c;但是对于第一次写操作的同步已经完成&＃xff0c;所以读操作已经可以读到最新的状态。
对于第一个问题&＃xff0c;需要使用主从复制的 semi-sync 模式&＃xff0c;上文中讲解介绍的是默认的异步模式&＃xff0c;semi-sync 模式的流程如下图所示&＃xff1a;
当主节点事务提交的时候&＃xff0c;Dump Thread 把 binlog 发给从节点&＃xff1b;
从节点的 IO Thread 收到 binlog 以后&＃xff0c;发回给主节点一个 ack&＃xff0c;表示收到了&＃xff1b;
主节点的 Dump Thread 收到这个 ack 以后&＃xff0c;再通知 Client Thread &＃xff0c;此时才能给客户端返回执行成功的响应。
这样&＃xff0c;写操作执行后&＃xff0c;就确保从节点已经读取到主节点发送的 binglog 数据&＃xff0c;即 Master_Log_File、 Read_Master_Log_Pos 或 Retrieved_Gtid_Set 是最新的&＃xff0c;这样才能与执行的相关数据进行对比&＃xff0c;判断是否有延迟。
可惜的是&＃xff0c;上述 semi-sync 模式只需要等待一个从节点的ACK&＃xff0c;所以一主多从的模式该方案将会无效。
虽然该方案有种种问题&＃xff0c;但是对于一致性要求不那么高的场景也能适用&＃xff0c;比如 MyCat 就是用 seconds_behind_master 是否落后主节点过多&＃xff0c;如果超过一定阈值&＃xff0c;就将其从有效从节点列表中删除&＃xff0c;不再将读请求路由到它身上。
在 MyCAT 的用于监听从节点状态&＃xff0c;发送心跳的 MySQLDetector 类中&＃xff0c;它会读取从节点的 seconds_behind_master&＃xff0c;如果其值大于配置的 slaveThreshold&＃xff0c;则将打印日志&＃xff0c;并将延迟时间设置到心跳信息中。
String Seconds_Behind_Master &＃61; resultResult.get( "Seconds_Behind_Master"); if (null &＃61;&＃61; Seconds_Behind_Master ){MySQLHeartbeat.LOGGER.warn("Master is down but its relay log is clean.");heartbeat.setSlaveBehindMaster(0); }elseif(!"".equals(Seconds_Behind_Master)) {int Behind_Master &＃61; Integer.parseInt(Seconds_Behind_Master);if ( Behind_Master > source.getHostConfig().getSlaveThreshold() ) {MySQLHeartbeat.LOGGER.warn("found MySQL master/slave Replication delay !!! "&＃43; heartbeat.getSource().getConfig() &＃43; ", binlog sync time delay: " &＃43; Behind_Master &＃43; "s" );} heartbeat.setSlaveBehindMaster( Behind_Master ); }
下面&＃xff0c;我们就介绍能够解决第二个问题的方案&＃xff0c;即判断有延迟&＃xff0c;但是读操作读取的特定最新状态已经同步。
等GTID 方案
首先介绍一下 GTID&＃xff0c;也就是全局事务 ID&＃xff0c;是一个事务在提交的时候生成的&＃xff0c;是这个事务的唯一标识。它由MySQL 实例的uuid和一个整数组成&＃xff0c;该整数由该实例维护&＃xff0c;初始值是 1&＃xff0c;每次该实例提交事务后都会加一。
MySQL 提供了一条基于 GTID 的命令&＃xff0c;用于在从节点上执行&＃xff0c;等待从库同步到了对应的 GTID&＃xff08;binlog文件中会包含 GTID&＃xff09;&＃xff0c;或者超时返回。
`select wait_for_executed_gtid_set(gtid_set, timeout);`
MySQL 在执行完事务后&＃xff0c;会将该事务的 GTID 会给客户端&＃xff0c;然后客户端可以使用该命令去要执行读操作的从库中执行&＃xff0c;等待该 GTID&＃xff0c;等待成功后&＃xff0c;再执行读操作&＃xff1b;如果等待超时&＃xff0c;则去主库执行读操作&＃xff0c;或者再换一个从库执行上述流程。
MariaDB 的 MaxScale 就是使用该方案&＃xff0c;MaxScale 是 MariaDB 开发的一个数据库智能代理服务(也支持 MySQL)&＃xff0c;允许根据数据库 SQL 语句将请求转向目标一个到多个服务器&＃xff0c;可设定各种复杂程度的转向规则。
MaxScale 在其 readwritesplit.hh 头文件和 rwsplit_causal_reads.cc 文件中的 add_prefix_wait_gtid 函数中使用了上述方案。
`#define MYSQL_WAIT_GTID_FUNC "WAIT_FOR_EXECUTED_GTID_SET"staticconstchar gtid_wait_stmt[] &＃61;"SET &＃64;maxscale_secret_variable&＃61;(SELECT CASE WHEN %s(&＃39;%s&＃39;, %s) &＃61; 0 ""THEN 1 ELSE (SELECT 1 FROM INFORMATION_SCHEMA.ENGINES) END);";GWBUF* RWSplitSession::add_prefix_wait_gtid(uint64_t version, GWBUF* origin) {....snprintf(prefix_sql, prefix_len, gtid_wait_stmt, wait_func, gtid_position.c_str(), gtid_wait_timeout);.... }`
举个例子&＃xff0c;原来要执行读操作的 SQL 和添加了前缀的 SQL 如下所示&＃xff1a;
`SELECT * FROM&＃96;city&＃96;; SET &＃64;maxscale_secret_variable&＃61;(SELECTCASEWHEN WAIT_FOR_EXECUTED_GTID_SET(&＃39;232-1-1&＃39;, 10) &＃61; 0THEN1ELSE (SELECT1FROM INFORMATION_SCHEMA.ENGINES) END); SELECT * FROM&＃96;city&＃96;;`
当
WAIT_FOR_EXECUTED_GTID_SET 执行失败后&＃xff0c;原 SQL 就不会再执行&＃xff0c;而是将该 SQL 去主节点执行。
资源获取&＃xff1a;
大家点赞、收藏、关注、评论啦、查看&＃x1f447;&＃x1f3fb;&＃x1f447;&＃x1f3fb;&＃x1f447;&＃x1f3fb;微信公众号获取联系方式&＃x1f447;&＃x1f3fb;&＃x1f447;&＃x1f3fb;&＃x1f447;&＃x1f3fb;
精彩专栏推荐订阅&＃xff1a;在下方专栏&＃x1f447;&＃x1f3fb;&＃x1f447;&＃x1f3fb;&＃x1f447;&＃x1f3fb;&＃x1f447;&＃x1f3fb;
每天学四小时&＃xff1a;Java&＃43;Spring&＃43;JVM&＃43;分布式高并发&＃xff0c;架构师指日可待

推荐阅读

post
Python 实现监控与运维自动化方案

本文探讨了使用Python实现监控信息收集的方法，涵盖从基础的日志记录到复杂的系统运维解决方案，旨在帮助开发者和运维人员提升工作效率。 ... [详细]

蜡笔小新 2024-11-23 11:25:14
select
必须为元素类型 mapper 声明属性 namespace解决

在使用mybatis进行mapper.xml测试的时候发生必须为元素类型“mapper”声明属性“namespace”的错误项目目录结构UserMapper和UserMappe ... [详细]

蜡笔小新 2024-11-23 20:06:58
get
Spring Security基础配置详解

本文详细介绍了Spring Security的基础配置方法，包括如何搭建Maven多模块工程以及具体的安全配置步骤，帮助开发者更好地理解和应用这一强大的安全框架。 ... [详细]

蜡笔小新 2024-11-22 20:52:07
js
深入解析Apache Mina开发指南

本文由chszs撰写，详细介绍了Apache Mina框架的核心开发流程及自定义协议处理方法。文章涵盖从创建IoService实例到协议编解码的具体步骤，适合希望深入了解Mina框架应用的开发者。 ... [详细]

蜡笔小新 2024-11-23 15:02:21
foreach
D17：C#设计模式之十六观察者模式（Observer Pattern）【行为型】

一、引言今天是2017年11月份的最后一天，也就是2017年11月30日，利用今天再写一个模式，争取下个月（也就是12月份& ... [详细]

蜡笔小新 2024-11-22 19:45:55
post
Kubernetes Services详解

本文深入探讨了Kubernetes中的服务（Services）概念，解释了如何通过Services实现Pods之间的稳定通信，以及如何管理没有选择器的服务。 ... [详细]

蜡笔小新 2024-11-24 18:37:01
main
[NOI2012]

来自FallDream的博客，未经允许，请勿转载，谢谢。一天一套noi简直了.昨天勉强做完了noi2011今天教练又丢出来一套noi ... [详细]

蜡笔小新 2024-11-24 17:13:08
get
在Linux系统中使用EncFS实现文件夹加密

为了保护个人隐私或敏感数据不被未经授权的访问，可以通过加密技术来增强安全性。本文介绍如何在Linux系统上使用EncFS工具创建和管理加密文件夹，以确保即使在系统登录状态下，特定文件夹中的数据也保持加密状态。 ... [详细]

蜡笔小新 2024-11-24 17:06:52
get
MyBatis中SQL查询参数传递方法详解

本文详细介绍了在MyBatis框架中如何通过#和$两种方式来传递SQL查询参数。使用#方式可以提高执行效率，而使用$则有助于在复杂SQL语句中更好地查看日志。此外，文章还探讨了不同场景下的参数传递方法，包括实体对象、基本数据类型以及混合参数的使用。 ... [详细]

蜡笔小新 2024-11-24 15:36:41
post
使用Java调用阿里云服务发送短信验证码

本文介绍如何通过Java代码调用阿里云短信服务API来实现短信验证码的发送功能，包括必要的依赖添加和关键代码示例。 ... [详细]

蜡笔小新 2024-11-24 13:19:44
main
设计模式原则3依赖倒置原则

个人博客：打开链接依赖倒置原则定义依赖倒置原则(DependenceInversionPrinciple,DIP)定义如下：Highlevelmo ... [详细]

蜡笔小新 2024-11-24 10:45:18
main
MySQL URL 配置中的时区问题及其解决方案

在使用 MySQL 6.0.x 及以上版本的 JDBC 驱动时，若未正确配置 `serverTimezone` 参数，可能会导致连接异常。本文探讨了这一问题的原因及解决方法。 ... [详细]

蜡笔小新 2024-11-24 09:23:26
post
基于角色的权限管理在AspNetForums中的应用

本文探讨了在AspNetForums平台中实施基于角色的权限控制系统的方法，旨在为不同级别的用户提供合适的访问权限，确保系统的安全性和可用性。 ... [详细]

蜡笔小新 2024-11-23 18:42:29
input
Java Socket编程指南：构建多客户端支持的服务端

本文基于Java官方文档进行了适当修改，旨在介绍如何实现一个能够同时处理多个客户端请求的服务端程序。在前文中，我们探讨了单客户端访问的服务端实现，而本篇将深入讲解多客户端环境下的服务端设计与实现。 ... [详细]

蜡笔小新 2024-11-22 23:16:34
schema
binlog2sql，你该知道的数据恢复工具

binlog2sql，你该知道的数据恢复工具 ... [详细]

蜡笔小新 2024-11-22 18:58:43

假爱多慌乱

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章