MySQL数据库_腾讯云数据库团队：MySQL数据库的高可用性分析

作者：prince小乀朱 | 来源：互联网 | 2023-08-06 18:45

篇首语：本文由编程笔记#小编为大家整理，主要介绍了腾讯云数据库团队：MySQL数据库的高可用性分析相关的知识，希望对你有一定的参考价值。作

篇首语：本文由编程笔记#小编为大家整理，主要介绍了腾讯云数据库团队：MySQL数据库的高可用性分析相关的知识，希望对你有一定的参考价值。

作者介绍：易固武，腾讯高级工程师，参与腾讯账号安全建设，腾讯数据仓库（TDW）优化改造，腾讯云数据库等项目，对大规模分布式存储和计算系统有浓厚的兴趣和经历

mysql数据库是目前开源应用最大的关系型数据库，有海量的应用将数据存储在MySQL数据库中。存储数据的安全性和可靠性是生产数据库的关注重点。本文分析了目前采用较多的保障MySQL可用性方案。

MySQL Replication

MySQL Replication是MySQL官方提供的主从同步方案，用于将一个MySQL实例的数据，同步到另一个实例中。Replication为保证数据安全做了重要的保证，也是现在运用最广的MySQL容灾方案。Replication用两个或以上的实例搭建了MySQL主从复制集群，提供单点写入，多点读取的服务，实现了读的scale out。
技术分享
图1. MySQL Replication主从复制集群

如图一所示，一个主实例（M），三个从实例（S），通过replication，Master生成event的binlog，然后发给slave，Slave将event写入relaylog，然后将其提交到自身数据库中，实现主从数据同步。对于数据库之上的业务层来说，基于MySQL的主从复制集群，单点写入Master，在event同步到Slave后，读逻辑可以从任何一个Slave读取数据，以读写分离的方式，大大降低Master的运行负载，同时提升了Slave的资源利用。

对于高可用来说，MySQL Replication有个重要的缺陷：数据复制的时延。在通常情况下，MySQL Replication数据复制是异步的，即是MySQL写binlog后，发送给Slave并不等待Slave返回确认收到，本地事务就提交了。一旦出现网络延迟或中断，数据延迟发送到Slave侧，主从数据就会出现不一致。在这个阶段中，Master一旦宕机，未发送到Slave的数据就丢失了，无法做到数据的高可用。

为了解决这个问题，google提供了解决方案：半同步和同步复制。在数据异步复制的基础之上，做了一点修改。半同步复制是Master等待event写入Slave的relay后，再提交本地，保证Slave一定收到了需要同步的数据。同步复制不不仅是要求Slave收到数据，还要求Slave将数据commit到数据库中，从而保证每次的数据写入，主从数据都是一致的。

基于半同步和同步复制，MySQL Replication的高可用得到了质的提升，特别是同步复制。基于同步复制的MySQL Replication集群，每个实例读取的数据都是一致的，不会存在Slave幻读。同时，Master宕机后，应用程序切换到任何一个Slave都可以保证读写数据的一致性。但是，同步复制带来了重大的性能下降，这里需要做一个折衷。另外，MySQL Replication的主从切换需要人工介入判断，同时需要Slave的replaylog提交完毕，故障恢复时间会比较长。

MySQL Fabric

MySQL Fabric是MySQL社区提供的管理多个MySQL服务的扩展。高可用是它设计的主要特性之一。

Fabric将两个及以上的MySQL实例划分为一个HA Group。其中的一个是主，其余的都是从。HA Group保证访问指定HA Group的数据总是可用的。其基础的数据复制是基于MySQL Replication，然后，Fabric提供了更多的特性：

失效检测和恢复：Fabric监控HA Group中的主实例，一旦发现主实例失效，Fabric会从HA Group中剩余的从实例中选择一个，并将其提升为主实例。

读写均衡：Fabric可以自动的处理一个HA Group的读写操作，将写操作发送给主实例，而读请求在多个从实例之间做负载均衡。
技术分享
图2. Fabric

MHA

MHA（MySQL-master-ha）是目前广泛使用的MySQL主从复制的高可用方案。MHA设计目标是自动实现主实例宕机后，从机切换为主，并尽量降低切换时延（通常在10-30s内切换完成）。同时，由MHA保证在切换过程中的数据一致性。MHA对MySQL的主从复制集群非常友好，没有对集群做任何侵入性的修改。

MHA的一个重点特性是：在主实例宕机后，MHA可以自动的判断主从复制集群中哪个从实例的relaylog是最新的，并将最新从实例的差异log“应用”到其余的从实例中，从而保证每个实例的数据一致。通常情况下，MHA需要10s左右检测主实例异常，并将主实例关闭从而避免脑裂。然后再用10s左右将差异的log event同步，并启用新的Master。整个MHA的RTO时间大约在30s。

MySQL Cluster

MySQL Cluster是一个高度可扩展的，兼容ACID事务的实时数据库，基于分布式架构不存在单点故障，MySQL Cluster支持自动水平扩容，并能做自动的读写负载均衡。

MySQL Cluster使用了一个叫NDB的内存存储引擎来整合多个MySQL实例，提供一个统一的服务集群。如图三所示。
技术分享
图3. MySQL Cluster组成

MySQL Cluster由SQL Nodes，DataNodes，和NDB Management Server组成。SQL Nodes是应用程序的接口，像普通的mysqld服务一样，接受用户的SQL输入，执行并返回结果。Data Nodes是数据存储节点，NDB Management Server用来管理集群中的每个node。

MySQL Cluster采用了新的数据分片和容错的方式来实现数据安全和高可用。其由Partition，Replica，Data Node，Node Group构成。

Partition：NDB一张表的一个数据分片，包含一张表的一部分数据。

Replica：一个Partition的拷贝。一个Partition可以有一个或多个Replica，一个Partition的所有Replica数据都是一致的。

Data Node：Replica的存储载体，每个Node存储一个或多个Replica。

Node Group：一个Data Node的集合。
技术分享
图4. MySQL Cluster数据高可用

一个MySQL Cluster有4个Node，被分为了两个Grou。Node1和2归属于Group0，Node3和4归属于Group1,。有一张表被分为4个Partition，并分别有两个Replica。Partition0和Partition2的两个Replica，分别存储在Node1和Node2上，Pratition1和Partition3的两个Replica分别存在Node3和Node4上。这样，对于一张表的一个Partition来说，在整个集群有两份数据，并分布在两个独立的Node上，实现了数据容灾。同时，每次对一个Partition的写操作，都会在两个Replica上呈现，如果Primary Replica异常，那么Backup Replica可以立即提供服务，实现数据的高可用。

小结

本文分析了目前MySQL使用较多的几种MySQL数据复制和高可用方案，从使用来看，MySQL Replication是使用最为广泛的数据复制方案，因为是MySQL原生支持，针对其在不同场景下的一些缺陷，衍生出了半同步复制，强同步复制等数据高可用的方案。在此基础之上，为了运维方便，MySQL Fabric和MHA应运而生，从不同的方向解决了主从切换时数据一致性问题和流程自动化的问题。此外，随着分布式系统架构和方案的逐步成熟。MySQL Cluster设计了全新的分布式架构，采用多副本，Sharding等特性，支持水平扩展，做到了5个9的数据库服务质量保证。

参考文献
1.http://dev.mysql.com/doc/refman/5.7/en/mysql-cluster.html
2.https://code.google.com/p/mysql-master-ha/
3.https://www.mysql.com/products/enterprise/fabric.html

MySQL语句复制（SBR）的缺陷列举

基于Discuz的Mysql云数据库搬迁实例解析

云数据库CDB for MySQL相关文档

此文已由作者授权腾讯云技术社区发布，转载请注明文章出处，获取更多云计算技术干货，可请前往腾讯云技术社区

推荐阅读

python
一句话解决高并发的核心原则

本文介绍了解决高并发的核心原则，即将用户访问请求尽量往前推，避免访问CDN、静态服务器、动态服务器、数据库和存储，从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例，以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]

蜡笔小新 2023-12-12 10:56:24
python
2018年人工智能大数据的爆发，学Java还是Python？

本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代，Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言，容易上手。其特色之一是强制使用空白符作为语句缩进，使得新手可以快速上手。目前，Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣，欢迎加入qq群458345782。 ... [详细]

蜡笔小新 2023-12-14 20:08:28
python
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
python
t-io 2.0.0发布-法网天眼第一版的回顾和更新说明

本文回顾了t-io 1.x版本的工程结构和性能数据，并介绍了t-io在码云上的成绩和用户反馈。同时，还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后，详细介绍了t-io 2.0.0版本的更新内容，包括更简洁的使用方式和内置的httpsession功能。 ... [详细]

蜡笔小新 2023-12-14 10:17:48
string
解决Sharepoint 2013运行状况分析出现的“一个或多个服务器未响应”问题的方法

本文介绍了解决Sharepoint 2013运行状况分析中出现的“一个或多个服务器未响应”问题的方法。对于有高要求的客户来说，系统检测问题的存在是不可接受的。文章详细描述了解决该问题的步骤，包括删除服务器、处理分布式缓存留下的记录以及使用代码等方法。同时还提供了相关关键词和错误提示信息，以帮助读者更好地理解和解决该问题。 ... [详细]

蜡笔小新 2023-12-10 13:37:58
string
Sleuth+zipkin链路追踪SpringCloud微服务的解决方案

在庞大的微服务群中，随着业务扩展，微服务个数增多，系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来，实现请求链路跟踪。通过Feign调用和Request传递TraceId，将整个调用链路的服务日志归组合并，提供定位和追踪的功能。 ... [详细]

蜡笔小新 2023-12-09 19:14:50
string
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
list
Nginx使用（server参数配置）

本文介绍了Nginx的使用，重点讲解了server参数配置，包括端口号、主机名、根目录等内容。同时，还介绍了Nginx的反向代理功能。 ... [详细]

蜡笔小新 2023-12-14 17:08:34
python
90后程序员的职业发展之路：从年薪3w到30w的经验分享

本文是一位90后程序员分享的职业发展经验，从年薪3w到30w的薪资增长过程。文章回顾了自己的青春时光，包括与朋友一起玩DOTA的回忆，并附上了一段纪念DOTA青春的视频链接。作者还提到了一些与程序员相关的名词和团队，如Pis、蛛丝马迹、B神、LGD、EHOME等。通过分享自己的经验，作者希望能够给其他程序员提供一些职业发展的思路和启示。 ... [详细]

蜡笔小新 2023-12-14 15:22:09
list
Redis数据结构之string应用场景解析

本文介绍了Redis的基础数据结构string的应用场景，并以面试的形式进行问答讲解，帮助读者更好地理解和应用Redis。同时，描述了一位面试者的心理状态和面试官的行为。 ... [详细]

蜡笔小新 2023-12-14 14:02:42
string
知识图谱——机器大脑中的知识库

本文介绍了知识图谱在机器大脑中的应用，以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例，说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案，如搜索关键词"Marie Curie"，会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革，不仅美国的微软必应，中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]

蜡笔小新 2023-12-14 10:06:19
cookie
Web学习历程记录（七）——Tomcat基本概念和配置

本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念，以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器，包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实，适合初学者了解Tomcat的基础知识。 ... [详细]

蜡笔小新 2023-12-13 17:08:24
js
ABAP开发发送邮件程序的配置和代码整理

本文介绍了通过ABAP开发往外网发邮件的需求，并提供了配置和代码整理的资料。其中包括了配置SAP邮件服务器的步骤和ABAP写发送邮件代码的过程。通过RZ10配置参数和icm/server_port_1的设定，可以实现向Sap User和外部邮件发送邮件的功能。希望对需要的开发人员有帮助。摘要长度：184字。 ... [详细]

蜡笔小新 2023-12-13 15:50:17
dll
如何在Windows环境下配置php+apache环境

本文介绍了在Windows环境下如何配置php+apache环境，包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]

蜡笔小新 2023-12-13 10:39:24
js
flowable工作流流程变量_信也科技工作流平台的技术实践

1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下：目前OA流程引擎无法满足企业特定业务流程需求，且移动端体 ... [详细]

蜡笔小新 2023-12-13 10:17:15

prince小乀朱

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章