zookeeper原理和机制zookeeper架构及节点功能zookeeper节点的作用

首页
zookeeper原理和机制zookeeper架构及节点功能zookeeper节点的作用

zookeeper原理和机制zookeeper架构及节点功能zookeeper节点的作用

2022-07-21 2:27:12 网络知识 官方管理员

224|0条评论

一、ZooKeeper基本概念

1、ZooKeeper是什么？

Zookeeper官网地址

Zookeeper官网文档地址

ZooKeeper是Hadoop下的一个子项目，它是一个针对大型分布式系统的可靠协调系统；它提供的功能包括：配置维护、名字服务、分布式同步、组服务等；它的目标就是封装好复杂易出错的关键服务，将简单易用的接口和性能高效、功能稳定的系统提供给用户。

Zookeeper一个最常用的使用场景就是用于担任服务生产者和服务消费者的注册中心，服务生产者将自己提供的服务注册到Zookeeper中心，服务的消费者在进行服务调用的时候先到Zookeeper中查找服务，获取到服务生产者的详细信息之后，再去调用服务生产者的内容与数据，简单示例图如下：

2、ZooKeeper设计目标：

ZooKeeper允许分布式进程通过共享的层次结构命名空间进行相互协调，这与标准文件系统类似。名称空间由ZooKeeper中的数据寄存器组成-称为znode，这些类似于文件和目录。与为存储设计的典型文件系统不同，ZooKeeper数据保存在内存中，这意味着ZooKeeper可以实现高吞吐量和低延迟。

Zookeeper层次结构命名空间示意图如下：

通过这种树图结构的数据模型，很容易的查找到具体的某一个服务。

3、ZooKeeper主要特点

1)、最终一致性：为客户端展示同一视图，这是ZooKeeper最重要的性能。

2)、可靠性：如果消息被一台服务器接受，那么它将被所有的服务器接受。

3)、实时性：ZooKeeper不能保证两个客户端同时得到刚更新的数据，如果

需要最新数据，应该在读数据之前调用sync()接口。

4)、等待无关（wait-free）：慢的或者失效的client不干预快速的client的请求。

5)、原子性：更新只能成功或者失败，没有中间其它状态。

6)、顺序性：对于所有Server，同一消息发布顺序一致。

二、ZooKeeper基本原理

1、ZooKeeper系统架构

首先看一下ZooKeeper的架构图。

ZooKeeper的架构图中我们需要了解和掌握的主要有：

（1）ZooKeeper分为服务器端（Server）和客户端（Client），客户端可以连接到整个ZooKeeper服务的任意服务器上（除非leaderServes参数被显式设置，leader不允许接受客户端连接）。

（2）客户端使用并维护一个TCP连接，通过这个连接发送请求、接受响应、获取观察的事件以及发送心跳。如果这个TCP连接中断，客户端将自动尝试连接到另外的ZooKeeper服务器。客户端第一次连接到ZooKeeper服务时，接受这个连接的ZooKeeper服务器会为这个客户端建立一个会话。当这个客户端连接到另外的服务器时，这个会话会被新的服务器重新建立。

（3）上图中每一个Server代表一个安装Zookeeper服务的机器，即是整个提供Zookeeper服务的集群（或者是由伪集群组成）；

（4）组成ZooKeeper服务的服务器必须彼此了解。它们维护一个内存中的状态图像，以及持久存储中的事务日志和快照，只要大多数服务器可用，ZooKeeper服务就可用；

（5）ZooKeeper启动时，将从实例中选举一个leader，Leader负责处理数据更新等操作，一个更新操作成功的标志是当且仅当大多数Server在内存中成功修改数据。每个Server在内存中存储了一份数据。

（6）Zookeeper是可以集群复制的，集群间通过Zab协议（ZookeeperAtomicBroadcast）来保持数据的一致性；

（7）Zab协议包含两个阶段：leaderelection阶段和AtomicBrodcast阶段。

a)集群中将选举出一个leader，其他的机器则称为follower，所有的写操作都被传送给leader，并通过brodcast将所有的更新告诉给follower。
b)当leader崩溃或者leader失去大多数的follower时，需要重新选举出一个新的leader，让所有的服务器都恢复到一个正确的状态。
c)当leader被选举出来，且大多数服务器完成了和leader的状态同步后，leadderelection的过程就结束了，就将会进入到Atomicbrodcast的过程。
d)AtomicBrodcast同步leader和follower之间的信息，保证leader和follower具有形同的系统状态。

2、Zookeeper角色

启动Zookeeper服务器集群环境后，多个Zookeeper服务器在工作前会选举出一个Leader。选举出leader前，所有server不区分角色，都需要平等参与投票（obServer除外，不参与投票）；

选主过程完成后，存在以下几种角色：

思考：

1、为什么需要server?

①ZooKeeper需保证高可用和强一致性;

②为了支持更多的客户端，需要增加更多的Server;

③Follower增多会导致投票阶段延迟增大，影响性能。

２、在Zookeeper中ObServer起到什么作用？

①ObServer不参与投票过程，只同步leader的状态;

②Observers接受客户端的连接，并将写请求转发给leader节点;

③加入更多ObServer节点，提高伸缩性，同时还不影响吞吐率。

３、为什么在Zookeeper中Server数目一般为奇数？

我们知道在Zookeeper中Leader选举算法采用了Zab协议。Zab核心思想是当多数Server写成功，则任务数据写成功。

①如果有3个Server，则最多允许1个Server挂掉。

②如果有4个Server，则同样最多允许1个Server挂掉。既然3个或者4个Server，同样最多允许1个Server挂掉，那么它们的可靠性是一样的，所以选择奇数个ZooKeeperServer即可，这里选择3个Server。

3、ZooKeeper写数据流程

ZooKeeper写数据的流程图如下所示。

ZooKeeper的写数据流程主要分为以下几步：

a)、比如Client向ZooKeeper的Server1上写数据，发送一个写请求。
b)、如果Server1不是Leader，那么Server1会把接受到的请求进一步转发给Leader，因为每个ZooKeeper的Server里面有一个是Leader。这个Leader会将写请求广播给各个Server，比如Server1和Server2，各个Server写成功后就会通知Leader。
c)、当Leader收到大多数Server数据写成功了，那么就说明数据写成功了。如果这里三个节点的话，只要有两个节点数据写成功了，那么就认为数据写成功了。写成功之后，Leader会告诉Server1数据写成功了。
d)、Server1会进一步通知Client数据写成功了，这时就认为整个写操作成功。

4、ZooKeeper组件

ZooKeeper组件显示了ZooKeeper服务的高级组件。除了请求处理器，组成ZooKeeper服务的每个服务器复制其自己的每个组件的副本。