ZooKeeper技术知识总结之二——ZK惊群与脑裂

作者：cang桑哥哥 | 来源：互联网 | 2023-10-11 12:52

接上篇《ZooKeeper 技术知识总结之一——Leader选举算法》

二. ZK 惊群与脑裂

2.1 Zookeeper 的惊群现象

ZooKeeper 的节点通常可以作为分布式锁来使用。比如可以多个服务对同时竞争申请一个节点 “/test/lock”，创建成功的服务获取到这个锁，其他没创建成功的监听这个锁，等到这个锁释放后再重新申请该锁。这样就实现了简单的分布式锁。
但同时在大量锁的情况下会有**“惊群”**的问题。“惊群”就是在一个节点删除的时候，大量对这个节点的删除动作有订阅Watcher的线程会进行回调，这对Zk集群是十分不利的。所以需要避免这种现象的发生。

为了解决“惊群“问题，我们需要放弃订阅一个节点的策略，那么怎么做呢？

我们将锁抽象成目录，多个线程在此目录下创建瞬时的顺序节点，因为Zk会为我们保证节点的顺序性，所以可以利用节点的顺序进行锁的判断。
首先创建顺序节点，然后获取当前目录下最小的节点，判断最小节点是不是当前节点，如果是那么获取锁成功，如果不是那么获取锁失败。
获取锁失败的节点获取当前节点上一个顺序节点，对此节点注册监听，当节点删除的时候通知当前节点。
当unlock的时候删除节点之后会通知下一个节点。

2.2 脑裂现象与 Zookeeper

参考地址：《脑裂是什么？Zookeeper是如何解决的？》

脑裂 (split-brain)，就是“大脑分裂”，也就是本来一个“大脑”被拆分了两个或多个“大脑”。我们都知道，如果一个人有多个大脑，并且相互独立的话，那么会导致人体“手舞足蹈”，“不听使唤”。这种现象经常出现于集群情况。
对于一个集群，想要提高这个集群的可用性，通常会采用多机房部署，比如现在有一个由6台 zkServer 所组成的一个集群，部署在了两个机房。正常情况下，此集群只会有一个 Leader。那么如果机房之间的网络断了之后，两个机房内的 zkServer 还是可以相互通信的，如果不考虑过半机制，那么就会出现每个机房内部都将选出一个 Leader，如下图所示：
ZooKeeper 技术知识总结之二——ZK 惊群与脑裂
实际上 Zookeeper 集群中是不会出现脑裂问题的，而不会出现的原因就跟过半机制有关。Zookeeper 选举时，必须接收到超过一半节点选择同样的节点，超过一半节点意味着不能等于一半节点。这里的原因用上面的问题可以很好的解释：
假设允许等于一半节点，那么假设两个机房都是三台服务器，中间两个机房的连接断了，那么两个机房内部选举，都会选出分别的 master，即出现了脑裂现象。
但是如果只允许大于一半节点，不允许等于，那么上面的情况，两边机房都不会选出新的 master。如果两个机房分别是 4 台，2 台节点，那么机房一所有节点的投票最终会相同，投票数量为 4，大于总服务器的一半，所以新的 master 节点只可能出现在机房一中。
ZooKeeper 技术知识总结之二——ZK 惊群与脑裂

推荐阅读

split
ZooKeeper集群脑裂问题及其解决方案

本文深入探讨了ZooKeeper集群中可能出现的脑裂问题，分析其成因，并提供了多种有效的解决方案，确保集群在高可用性环境下的稳定运行。 ... [详细]

蜡笔小新 2024-12-22 17:19:52
select
最强阿里及大厂350道面试大全：框架+数据库+并发+开源+微服务

前言无论是对于刚入行工作还是已经工作几年的java开发者来说，面试求职始终是你需要直面的一件事情。首先梳理自己的知识体系，针对性准备，会有事半功倍的效果。我们往往会把重点放在技术上 ... [详细]

蜡笔小新 2024-12-18 15:33:00
ip
ZooKeeper集群构建与详解

本文详细介绍了使用ZooKeeper构建高可用集群的方法，包括必要的软件环境准备、配置文件调整及集群启动等关键步骤。通常，一个ZooKeeper集群由奇数个节点组成，以确保Leader选举的有效性。 ... [详细]

蜡笔小新 2024-12-16 11:16:22
ip
收割机|篇幅_国内最牛逼的笔记，不接受反驳！！

收割机|篇幅_国内最牛逼的笔记，不接受反驳！！ ... [详细]

蜡笔小新 2024-12-14 10:20:42
go
SQL基础入门与数据库体系概述

本文介绍了数据库体系的基础知识，涵盖关系型数据库（如MySQL）和非关系型数据库（如MongoDB）的基本操作及高级功能。通过三个阶段的学习路径——基础、优化和部署，帮助读者全面掌握数据库的使用和管理。 ... [详细]

蜡笔小新 2024-12-22 19:17:15
select
优化DB2数据库性能的关键策略

本文详细介绍了优化DB2数据库性能的多种方法，涵盖统计信息更新、缓冲池调整、日志缓冲区配置、应用程序堆大小设置、排序堆参数调整、代理程序管理、锁机制优化、活动应用程序限制、页清除程序配置、I/O服务器数量设定以及编入组提交数调整等方面。通过这些技术手段，可以显著提升数据库的运行效率和响应速度。 ... [详细]

蜡笔小新 2024-12-22 16:20:33
go
深入解析Serverless架构模式

本文将详细介绍Serverless架构模式的核心概念、工作原理及其优势。通过对比传统架构，探讨Serverless如何简化应用开发与运维流程，并介绍当前主流的Serverless平台。 ... [详细]

蜡笔小新 2024-12-22 09:08:56
go
java程序员_Java程序员最新职业规划，逆袭面经分享

java程序员_Java程序员最新职业规划，逆袭面经分享 ... [详细]

蜡笔小新 2024-12-16 14:36:24
scala
window下kafka的安装以及测试

目录一、安装JDK（需要安装依赖javaJDK）二、安装Kafka三、测试参考在Windows系统上安装消息队列kafka一、安装JDKÿ ... [详细]

蜡笔小新 2024-12-16 12:01:36
scala
Kafka Topic 数据管理与清理策略

本文探讨了在生产环境中如何有效管理和定期清理Kafka Topic中的数据。介绍了基于时间、日志大小和日志起始偏移量三种清除方式，并重点讲解了基于时间的清除策略及其配置方法。 ... [详细]

蜡笔小新 2024-12-15 13:50:22
ip
如何配置网络连接的IP地址

本文详细介绍了如何在不同操作系统和设备上设置和配置网络连接的IP地址，涵盖静态和动态IP地址的设置方法。同时，提供了关于路由器和机顶盒等设备的IP配置指南。 ... [详细]

蜡笔小新 2024-12-22 18:45:18
format
SQL数据库面试题解析

本文深入探讨了SQL数据库中常见的面试问题，包括如何获取自增字段的当前值、防止SQL注入的方法、游标的作用与使用、索引的形式及其优缺点，以及事务和存储过程的概念。通过详细的解答和示例，帮助读者更好地理解和应对这些技术问题。 ... [详细]

蜡笔小新 2024-12-22 14:43:35
format
华为智慧屏：超越屏幕尺寸的智能进化

继全球发布后，华为智慧屏于9月26日在上海正式亮相，推出65英寸和75英寸版本。该产品不仅在屏幕尺寸上有所突破，更在性能和智能化方面实现了显著提升。 ... [详细]

蜡笔小新 2024-12-22 12:40:05
ip
如何查找和设置网卡配置

本文详细介绍了在不同操作系统中查找和设置网卡的方法，涵盖了Windows系统的具体步骤，并提供了关于网卡位置、无线网络设置及常见问题的解答。 ... [详细]

蜡笔小新 2024-12-22 10:35:47
object
Mathematica 12.3.1 中英文版正式发布，附新功能介绍

历经三十年的开发，Mathematica 已成为技术计算领域的标杆，为全球的技术创新者、教育工作者、学生及其他用户提供了一个领先的计算平台。最新版本 Mathematica 12.3.1 增加了多项核心语言、数学计算、可视化和图形处理的新功能。 ... [详细]

蜡笔小新 2024-12-22 09:34:59

cang桑哥哥

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章