ZooKeeper？你了解了，用对了吗？

作者：粉爱_粉爱陈小翔 | 来源：互联网 | 2023-09-17 12:41

没有参加抽奖活动的赶紧啦，粉丝福利，免费送8本技术书快捷入口！前言相信大家对ZooK

没有参加抽奖活动的赶紧啦，粉丝福利，免费送8本技术书快捷入口！

前言

相信大家对 ZooKeeper 应该不算陌生。但是你真的了解 ZooKeeper 是个什么东西吗？如果别人/面试官让你给他讲讲 ZooKeeper 是个什么东西，你能回答到什么地步呢？

我本人曾经使用过 ZooKeeper 作为 Dubbo 的注册中心，另外在搭建 solr 集群的时候，我使用到了 ZooKeeper 作为 solr 集群的管理工具。前几天，总结项目经验的时候，我突然问自己 ZooKeeper 到底是个什么东西？想了半天，脑海中只是简单的能浮现出几句话：“①Zookeeper 可以被用作注册中心。②Zookeeper可以用作分布式锁；③构建 Zookeeper 集群的时候，使用的服务器最好是奇数台。” 可见，我对于 Zookeeper 的理解仅仅是停留在了表面。

所以我先从查阅官网，wiki开始入手了

官网还有另一段话：

ZooKeeper: A Distributed Coordination Service for Distributed Applications

相比于官网的介绍，我其实更喜欢Wiki中对ZooKeeper的介绍：

(奈何我英语太差了)

我简单概括一下：

ZooKeeper主要服务于分布式系统，可以用ZooKeeper来做：统一配置管理、统一命名服务、分布式锁、集群管理。
使用分布式系统就无法避免对节点管理的问题(需要实时感知节点的状态、对节点进行统一管理等等)，而由于这些问题处理起来可能相对麻烦和提高了系统的复杂性，ZooKeeper作为一个能够通用解决这些问题的中间件就应运而生了。

所以，通过本文，希望带大家稍微详细的了解一下 ZooKeeper 。如果没有学过 ZooKeeper ，那么本文将会是你进入 ZooKeeper 大门的垫脚砖。如果你已经接触过 ZooKeeper ，那么本文将带你回顾一下 ZooKeeper 的一些基础概念。

一什么是 ZooKeeper

1.1 ZooKeeper 概览

ZooKeeper 是一个开源的分布式协调服务，ZooKeeper框架最初是在“Yahoo!"上构建的，用于以简单而稳健的方式访问他们的应用程序。后来，Apache ZooKeeper成为Hadoop，HBase和其他分布式框架使用的有组织服务的标准。例如，Apache HBase使用ZooKeeper跟踪分布式数据的状态。ZooKeeper 的设计目标是将那些复杂且容易出错的分布式一致性服务封装起来，构成一个高效可靠的原语集，并以一系列简单易用的接口提供给用户使用。

原语：操作系统或计算机网络用语范畴。是由若干条指令组成的，用于完成一定功能的一个过程。具有不可分割性·即原语的执行必须是连续的，在执行过程中不允许被中断。

ZooKeeper 是一个典型的分布式数据一致性解决方案，分布式应用程序可以基于 ZooKeeper 实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master 选举、分布式锁和分布式队列等功能。

Zookeeper 一个最常用的使用场景就是用于担任服务生产者和服务消费者的注册中心。服务生产者将自己提供的服务注册到Zookeeper中心，服务的消费者在进行服务调用的时候先到Zookeeper中查找服务，获取到服务生产者的详细信息之后，再去调用服务生产者的内容与数据。如下图所示，在 Dubbo架构中 Zookeeper 就担任了注册中心这一角色。

1.2 结合个人使用情况的讲一下 ZooKeeper

在我自己做过的项目中，主要使用到了 ZooKeeper 作为 Dubbo 的注册中心(Dubbo 官方推荐使用 ZooKeeper注册中心)。另外在搭建 solr 集群的时候，我使用 ZooKeeper 作为 solr 集群的管理工具。这时，ZooKeeper 主要提供下面几个功能：1、集群管理：容错、负载均衡。2、配置文件的集中管理3、集群的入口。

我个人觉得在使用 ZooKeeper 的时候，最好是使用集群版的 ZooKeeper 而不是单机版的。官网给出的架构图就描述的是一个集群版的 ZooKeeper 。通常 3 台服务器就可以构成一个 ZooKeeper 集群了。

为什么最好使用奇数台服务器构成 ZooKeeper 集群？

我们知道在Zookeeper中 Leader 选举算法采用了Zab协议。Zab核心思想是当多数 Server 写成功，则任务数据写成功。

①如果有3个Server，则最多允许1个Server 挂掉。

②如果有4个Server，则同样最多允许1个Server挂掉。

既然3个或者4个Server，同样最多允许1个Server挂掉，那么它们的可靠性是一样的，所以选择奇数个ZooKeeper Server即可，这里选择3个Server。

二 ZooKeeper 能做哪些事

首先我们了解下zookeeper有这些概念:

会话（Session）、 Znode、版本、Watcher、ACL

然后我们说一下它能干些什么：

统一配置管理、统一命名服务、分布式锁、集群管理等等。。。很多

那为什么ZooKeeper可以干那么多事？来看看ZooKeeper究竟是何方神物，在Wiki中其实也有提到：

ZooKeeper nodes store their data in a hierarchical name space, much like a file system or a tree data structure

ZooKeeper的数据结构，跟Unix文件系统非常类似，可以看做是一颗树，每个节点叫做ZNode。每一个节点可以通过路径来标识，结构图如下：

那ZooKeeper这颗"树"有什么特点呢？？ZooKeeper的节点我们称之为Znode，Znode分为两种类型：

短暂/临时(Ephemeral)：当客户端和服务端断开连接后，所创建的Znode(节点)会自动删除
持久(Persistent)：当客户端和服务端断开连接后，所创建的Znode(节点)不会删除

接下来讲讲监听器：

Watcher

Watcher（事件监听器），是Zookeeper中的一个很重要的特性。Zookeeper允许用户在指定节点上注册一些Watcher，并且在一些特定事件触发的时候，ZooKeeper服务端会将事件通知到感兴趣的客户端上去，该机制是Zookeeper实现分布式协调服务的重要特性。

常见的监听场景有以下两项：

监听Znode节点的数据变化
监听子节点的增减变化

下面我们来看看是怎么实现分布式锁的：

锁的概念在这我就不说了，如果对锁概念还不太了解的同学，可参考下面的文章

Java锁？分布式锁？乐观锁？行锁？

我们可以使用ZooKeeper来实现分布式锁，那是怎么做的呢？？下面来看看：

系统A、B、C都去访问/locks
节点

访问的时候会创建带顺序号的临时/短暂(EPHEMERAL_SEQUENTIAL
)节点，比如，系统A创建了id_000000
节点，系统B创建了id_000002
节点，系统C创建了id_000001
节点。

接着，拿到/locks
节点下的所有子节点(id_000000,id_000001,id_000002)，判断自己创建的是不是最小的那个节点

如果是，则拿到锁。

释放锁：执行完操作后，把创建的节点给删掉

如果不是，则监听比自己要小1的节点变化

举个例子：

系统A拿到/locks
节点下的所有子节点，经过比较，发现自己(id_000000
)，是所有子节点最小的。所以得到锁
系统B拿到/locks
节点下的所有子节点，经过比较，发现自己(id_000002
)，不是所有子节点最小的。所以监听比自己小1的节点id_000001
的状态
系统C拿到/locks
节点下的所有子节点，经过比较，发现自己(id_000001
)，不是所有子节点最小的。所以监听比自己小1的节点id_000000
的状态
……
等到系统A执行完操作以后，将自己创建的节点删除(id_000000
)。通过监听，系统C发现id_000000
节点已经删除了，发现自己已经是最小的节点了，于是顺利拿到锁
….系统B如上

三 ZooKeeper -ZAB 协议

Zab（Zookeeper Atomic Broadcast）是为ZooKeeper协设计的崩溃恢复原子广播协议，它保证zookeeper集群数据的一致性和命令的全局有序性。

在介绍zab协议之前首先要知道zookeeper相关的几个概念，才能更好的了解zab协议。

集群角色

Leader：同一时间集群总只允许有一个Leader，提供对客户端的读写功能，负责将数据同步至各个节点；
Follower：提供对客户端读功能，写请求则转发给Leader处理，当Leader崩溃失联之后参与Leader选举；
Observer：与Follower不同的是但不参与Leader选举。

服务状态

LOOKING：当节点认为群集中没有Leader，服务器会进入LOOKING状态，目的是为了查找或者选举Leader；
FOLLOWING：follower角色；
LEADING：leader角色；
OBSERVING：observer角色；

可以知道Zookeeper是通过自身的状态来区分自己所属的角色，来执行自己应该的任务。

ZAB状态Zookeeper还给ZAB定义的4中状态，反应Zookeeper从选举到对外提供服务的过程中的四个步骤。状态枚举定义：

public enum ZabState { ELECTION, DISCOVERY, SYNCHRONIZATION, BROADCAST }

ELECTION: 集群进入选举状态，此过程会选出一个节点作为leader角色；
DISCOVERY：连接上leader，响应leader心跳，并且检测leader的角色是否更改，通过此步骤之后选举出的leader才能执行真正职务；
SYNCHRONIZATION：整个集群都确认leader之后，将会把leader的数据同步到各个节点，保证整个集群的数据一致性；
BROADCAST：过渡到广播状态，集群开始对外提供服务。

ZXID

Zxid是极为重要的概念，它是一个long型（64位）整数，分为两部分：纪元（epoch）部分和计数器（counter）部分，是一个全局有序的数字。

epoch代表当前集群所属的哪个leader，leader的选举就类似一个朝代的更替，你前朝的剑不能斩本朝的官，用epoch代表当前命令的有效性，counter是一个递增的数字。

ZAB协议包括两种基本的模式，分别是崩溃恢复和消息广播。当整个服务框架在启动过程中，或是当 Leader 服务器出现网络中断、崩溃退出与重启等异常情况时，ZAB 协议就会进入恢复模式并选举产生新的Leader服务器。当选举产生了新的 Leader 服务器，同时集群中已经有过半的机器与该Leader服务器完成了状态同步之后，ZAB协议就会退出恢复模式。其中，所谓的状态同步是指数据同步，用来保证集群中存在过半的机器能够和Leader服务器的数据状态保持一致。

当集群中已经有过半的Follower服务器完成了和Leader服务器的状态同步，那么整个服务框架就可以进入消息广播模式了。当一台同样遵守ZAB协议的服务器启动后加人到集群中时，如果此时集群中已经存在一个Leader服务器在负责进行消息广播，那么新加人的服务器就会自觉地进入数据恢复模式：找到Leader所在的服务器，并与其进行数据同步，然后一起参与到消息广播流程中去。正如上文介绍中所说的，ZooKeeper设计成只允许唯一的一个Leader服务器来进行事务请求的处理。Leader服务器在接收到客户端的事务请求后，会生成对应的事务提案并发起一轮广播协议；而如果集群中的其他机器接收到客户端的事务请求，那么这些非Leader服务器会首先将这个事务请求转发给Leader服务器。

关于 ZAB 协议以及Paxos算法需要讲和理解的东西太多了，说实话，我到现在也不太清楚这俩兄弟的具体原理和实现过程。（打工人还是要继续努力搬砖啊）

最后

这篇文章主要讲解了ZooKeeper的入门相关的知识以及一些概念和用法，还有ZAB协议，ZooKeeper通过Znode的节点类型+监听机制就实现那么多好用的功能了！

当然了，ZooKeeper要考虑的事没那么简单的，后面有机会深入的话，我还会继续分享，希望这篇文章对大家有所帮助~

乐于输出干货的Java技术公众号：Garnett的Java之路。公众号内有大量的技术文章、海量视频资源、精美脑图，不妨来关注一下！回复【资料】领取大量学习资源和免费书籍！

推荐阅读

hbase
地理信息、定位技术及其在物联网中的应用

地理位置信息是物联网系统中不可或缺的关键要素，它不仅提供了物理世界的坐标，还增强了物联网应用的实用性和准确性。本文探讨了位置服务的基本概念、关键技术及其在物联网中的重要作用，特别介绍了定位技术的最新进展。 ... [详细]

蜡笔小新 2024-11-30 13:41:22
spring
高效利用Java异常处理

本文探讨了Java异常处理的本质，提出了设计模式以优化异常处理，并分析了在AOP模型中异常处理的应用。文章强调了正确使用Java异常对于提升代码质量和维护性的关键作用。 ... [详细]

蜡笔小新 2024-11-30 10:46:18
spring
Linux环境下PostgreSQL的安装、配置及日常管理

本文详细介绍了在Linux环境下安装、配置PostgreSQL数据库的过程，包括环境准备、安装步骤、配置数据库访问以及日常服务管理等方面的内容。适合初学者和有一定经验的数据库管理员参考。 ... [详细]

蜡笔小新 2024-12-01 10:36:36
install
CentOS 7.4 KVM虚拟化平台搭建指南

本文详细介绍了如何在CentOS 7.4系统上搭建KVM虚拟化平台，包括环境准备、网络配置、KVM安装与管理等步骤，适用于希望利用KVM进行虚拟化部署的技术人员。 ... [详细]

蜡笔小新 2024-11-30 19:43:44
install
MySQL事务管理：启动、设置、锁与解锁详解

本文详细介绍了MySQL 5.5及以上版本中事务管理的全过程，包括事务的启动、设置、锁机制以及解锁方法，旨在为开发者提供一个清晰、全面的操作指南，避免因网络资料分散而导致的学习障碍。 ... [详细]

蜡笔小新 2024-11-30 17:49:46
uri
树莓派实战指南：搭建Samba文件共享服务器

本文详细介绍如何在树莓派上安装并配置Samba服务，以实现与Windows系统的网络共享兼容性。适合初学者参考。 ... [详细]

蜡笔小新 2024-11-30 14:24:43
spring
第四十章：基于SpringBoot & Quartz完成定时任务分布式多节点负载持久化

在上一章【第三十九章：基于SpringBoot&Quartz完成定时任务分布式单节点持久化】中我们已经完成了任务的持久化，当我们创建一个任务时任务会被quartz定时任务框架自动持 ... [详细]

蜡笔小新 2024-11-30 14:05:25
spring
深入解析ZooKeeper：Java组件化开发必备技能

本文详细介绍了ZooKeeper作为分布式服务协调框架的核心功能与应用场景，包括其数据一致性解决方案、数据结构特点、监听通知机制及选举机制等，帮助开发者更好地理解和应用ZooKeeper。 ... [详细]

蜡笔小新 2024-11-30 10:51:40
uri
深入理解HTTP协议及其数据包

HTTP（超文本传输协议）是互联网上用于客户端和服务器之间交换数据的主要协议。本文详细介绍了HTTP的工作原理，包括其请求-响应机制、不同版本的发展历程以及HTTP数据包的具体结构。 ... [详细]

蜡笔小新 2024-11-30 10:36:22
uri
解决 IIS 无法访问 .pnts 文件的问题

本文详细介绍了在使用 IIS 服务器时遇到的 .pnts 文件无法访问的问题及其解决方案。通过正确配置 MIME 类型，可以轻松解决这一常见问题。 ... [详细]

蜡笔小新 2024-11-29 19:20:15
uri
Kafka安装与配置深度解析：程序员必备指南

Kafka 是由 Apache 软件基金会开发的高性能分布式消息系统，支持高吞吐量的发布和订阅功能，主要使用 Scala 和 Java 编写。本文将深入解析 Kafka 的安装与配置过程，为程序员提供详尽的操作指南，涵盖从环境准备到集群搭建的每一个关键步骤。 ... [详细]

蜡笔小新 2024-11-07 12:22:05
uri
开发笔记:Mongodb副本集集群搭建

开发笔记:Mongodb副本集集群搭建 ... [详细]

蜡笔小新 2024-11-30 16:16:20
node.js
新技术频现，开发经验仍是决定工作质量的关键

Mario Peshev，自1999年起从事编程工作，现任DevriX首席执行官。本文最初发布于Quora，探讨了计算机技术与编程语言的区别及其对软件开发的影响。 ... [详细]

蜡笔小新 2024-11-30 16:01:20
request
文件上传 02 服务端检测绕过(MIME类型检测)

本文记录文件上传学习过程，教程为《UploadAttackFrameworkV1.0》文件上传检测客户端javascript检测(通常为检测文件扩展名)服务端MIM ... [详细]

蜡笔小新 2024-11-30 15:50:56
netty
淘宝大数据产品技术架构解析

本文探讨了缓存系统中的两个关键问题——缓存穿透与缓存失效时的雪崩效应，以及这些问题的解决方案。此外，文章还介绍了数据处理、数据库拆分策略、缓存优化、拆分策略、应用架构演进及通信协议的选择等内容。 ... [详细]

蜡笔小新 2024-11-30 13:01:11