Zookeeper入门


Zookeeper

Zookeeper 概念

  • Zookeeper是ApacheHadoop项目下的一个子目录,是一个树形目录服务
  • Zookeeper翻译过来是 动物管理员,他是用来管理Hadoop(大象)、Hive(蜜蜂)、Pig(小猪)的管理员,简称zk
  • Zookeeper是一个分布式,开源的分布式应用程序的协调服务。
  • Zookeeper提供的主要功能包括:
    • 配置管理
    • 分布式锁
    • 集群管理

ZooKeeper命令操作

ZooKeeper数据模型

  • ZooKeeper是一个树形目录服务,其数据模型和Unix的文件 系统目录树很类似,拥有一个层次化结构。
  • 这里面的每一个节点都被称为:ZNode,每个节点都会保存自己的数据和节点信息。
  • 节点可以拥有子节点,同时也允许少量(1MB)数据存储在该节点之下。
  • 节点可以分为四大类:
    • PERSISTENT持久化节点
    • EPHEMERAL临时节点: -e
    • PERSISTENT_ SEQUENTIAL 持久化顺序节点: -S
    • EPHEMERAL SEQUENTIAL临时顺序节点: -es

ZooKeeper客户端常用命令

ZooKeeper JavaAPI操作

Curator介绍

  • Curator是Apache ZooKeeper的Java客户端库。
  • 常见的ZooKeeper Java API :
    • 原生JavaAPI
    • ZKClient
    • Curator
  • Curator项目的目标是简化ZooKeeper客户端的使用。

Curator API常用操作

  • 建立连接
  • 添加节点
  • 删除节点
  • 修改节点
  • 查询节点
  • Watch事件监听
  • 分布式锁的实现
public class CuratorTest {

    /**
     * 建立连接
     */
    @Test
    public void testConnect(){
        /**
         * @param connectString 连接字符串。zk server 地址和端口"192. 168. 149.135:2181, 192. 168. 149.136:2181”
         * @param sessionTimeoutMs 会话超时时间单位ms
         * @param connectionTimeoutMs 连接超时时间单位ms
         * @param retryPolicy 重试策略
         */
        // 重试策略
        RetryPolicy retryPolicy = new ExponentialBackoffRetry(3000,10);
        // 1.第一种方式
//        CuratorFramework client = CuratorFrameworkFactory.newClient("8.130.113.49:2181",
//                60 * 1000, 15 * 1000, retryPolicy);
//        client.start();
        // 2.第二种方式
        CuratorFramework client = CuratorFrameworkFactory.builder().connectString("8.130.113.49:2181")
                .sessionTimeoutMs(60 * 1000)
                .connectionTimeoutMs(15 * 1000)
                .retryPolicy(retryPolicy).build();
        client.start();
    }
}
public class CuratorTest {

    private CuratorFramework client;

    /**
     * 建立连接
     */
    @Before
    public void testConnect(){
        /**
         * @param connectString 连接字符串。zk server 地址和端口"192. 168. 149.135:2181, 192. 168. 149.136:2181”
         * @param sessionTimeoutMs 会话超时时间单位ms
         * @param connectionTimeoutMs 连接超时时间单位ms
         * @param retryPolicy 重试策略
         */
        // 重试策略
        RetryPolicy retryPolicy = new ExponentialBackoffRetry(3000,10);
        // 1.第一种方式
//        CuratorFramework client = CuratorFrameworkFactory.newClient("8.130.113.49:2181",
//                60 * 1000, 15 * 1000, retryPolicy);
//        client.start();
        // 2.第二种方式
        client = CuratorFrameworkFactory.builder().connectString("8.130.113.49:2181")
                .sessionTimeoutMs(60 * 1000)
                .connectionTimeoutMs(15 * 1000)
                .retryPolicy(retryPolicy)
                .namespace("itheima")
                .build();
        client.start();
        System.out.println("已经建立连接");
    }

    /**
     * 创建节点:create 持久化节点 临时 顺序 数据
     * 1.基本创建
     * 2.创建节点 带有数据
     * 3.设置节点类型
     * 4.创建多级节点 /app1/p1
     */
    @Test
    public void testCreate() throws Exception {
        System.out.println("开始写入节点");
        //1.基本创建
        // 如果创建节点,没有指定数据,则默认将当前客户端的ip作为数据存储
        String path = client.create().forPath("/app5");
        System.out.println(path);
        System.out.println("结束写入节点");
    }

    @Test
    public void testCreate2() throws Exception{
        System.out.println("开始写入节点");
        // 2.创建节点,带有数据
        String path = client.create().forPath("/app1","haha".getBytes());
        System.out.println(path);
        System.out.println("写入数据结束");
    }

    @Test
    public void testCreate3() throws Exception{
        String path = client.create().withMode(CreateMode.EPHEMERAL).forPath("/app3");
        System.out.println(path);
    }

    @Test
    public void testCreate4() throws Exception{
        // 创建多级节点
        // creatingParentsIfNeeded() 如果父节点不存在,,则创建父节点
        String path = client.create().creatingParentsIfNeeded().forPath("/app4/p1");;
        System.out.println(path);
    }

    /**
     * 查询节点
     * 1.查询数据:get
     * 2.查询子节点 ls
     * 3.查询节点状态信息:ls -s
     * @throws Exception
     */
    @Test
    public void testGet1() throws Exception{
        // 查询数据
        byte[] data = client.getData().forPath("/app1");
        System.out.println(new String(data));
    }

    @Test
    public void testGet2() throws Exception{
        // 查询子节点:ls
        List<String> path = client.getChildren().forPath("/app4");
        System.out.println(path);
    }

    @Test
    public void testGet3() throws Exception{
        Stat status = new Stat();
        System.out.println(status);
        // 3.查询节点状态信息:ls -s
        client.getData().storingStatIn(status).forPath("/app1");

        System.out.println(status);
    }

    /**
     * 修改数据
     * 1.修改数据
     * 2.根据版本修改
     * @throws Exception
     */
    @Test
    public void testSet() throws Exception{
        client.setData().forPath("/app1","itcast".getBytes());
        System.out.println("修改成功");
    }

    @Test
    public void testSetForVersion() throws Exception{
        Stat status = new Stat();
        // 3.查询节点状态信息:ls -s
        client.getData().storingStatIn(status).forPath("/app1");

        int version = status.getVersion(); //查询出来的
        System.out.println("版本号为:" + version);
        client.setData().withVersion(version).forPath("/app1","didi".getBytes());
    }

    /**
     * 删除节点:delete deleteall
     * 1.删除单个节点
     * 2.删除带有子节点的节点
     * 3.必须成功的删除
     * 4.回调
     * @throws Exception
     */
    @Test
    public void testDelete() throws Exception{
        // 1.删除单个节点
        client.delete().forPath("/app1");
    }

    @Test
    public void testDelete2() throws Exception{
        // 2.删除带有子节点的节点
        client.delete().deletingChildrenIfNeeded().forPath("/app4");
    }

    @Test
    public void testDelete3() throws Exception{
        //3.必须删除成功
        client.delete().guaranteed().forPath("/app2");
    }

    @Test
    public void testDelete4() throws Exception{
        // 4.回调
        client.delete().guaranteed().inBackground(new BackgroundCallback() {
            @Override
            public void processResult(CuratorFramework curatorFramework, CuratorEvent event) throws Exception {
                System.out.println("我被删除了~");
                System.out.println(event);
            }
        }).forPath("/app2");
    }

    @After
    public void close(){
        if (client != null){
            client.close();
            System.out.println("关闭成功");
        }
    }
}

Curator API常用操作- Watch事件监听

  • ZooKeeper允许用户在指定节点上注册一些Watcher, 并且在一些特定事件触发的时候, ZooKeeper 服务端会将事件通
    知到感兴趣的客户端上去,该机制是ZooKeeper实现分布式协调服务的重要特性。
  • ZooKeeper中引入了Watcher机制来实现了发布/订阅功能能,能够让多个订阅者同时监听某一 个对象,当-个对象自身状态变化时,会通知所有订阅者。
  • ZooKeeper原生支持通过注册Watcher来进行事件监听,但是其使用并不是特别方便需要开发人员自己反复注册Watcher,比较繁琐。
  • Curator引入了Cache来实现对ZooKeeper服务端事件的监听。
  • ZooKeeper提供了三种Watcher:
    • NodeCache:只是监听某一个特定的节点
    • PathChildrenC ache:监控一个ZNode的子节点.
    • TreeCache:可以监控整个树上的所有节点,类似于PathChildrenCache和NodeCache的组合
public class CuratorWatcherTest {

    private CuratorFramework client;

    /**
     * 建立连接
     */
    @Before
    public void testConnect(){
        /**
         * @param connectString 连接字符串。zk server 地址和端口"192. 168. 149.135:2181, 192. 168. 149.136:2181”
         * @param sessionTimeoutMs 会话超时时间单位ms
         * @param connectionTimeoutMs 连接超时时间单位ms
         * @param retryPolicy 重试策略
         */
        // 重试策略
        RetryPolicy retryPolicy = new ExponentialBackoffRetry(3000,10);
        // 1.第一种方式
//        CuratorFramework client = CuratorFrameworkFactory.newClient("8.130.113.49:2181",
//                60 * 1000, 15 * 1000, retryPolicy);
//        client.start();
        // 2.第二种方式
        client = CuratorFrameworkFactory.builder().connectString("8.130.113.49:2181")
                .sessionTimeoutMs(60 * 1000)
                .connectionTimeoutMs(15 * 1000)
                .retryPolicy(retryPolicy)
                .namespace("itheima")
                .build();
        client.start();
        System.out.println("已经建立连接");
    }

    @After
    public void close(){
        if (client != null){
            client.close();
            System.out.println("关闭成功");
        }
    }

    /**
     * 演示 NodeCache:给指定的一个节点注册监听器
     */
    @Test
    public void testNodeCache() throws Exception {
        // 1.创建NodeCache对象
        NodeCache nodeCache = new NodeCache(client,"/app1");
        // 2.注册监听
        nodeCache.getListenable().addListener(new NodeCacheListener() {
            @Override
            public void nodeChanged() throws Exception {
                System.out.println("节点变化了~");
                byte[] data = nodeCache.getCurrentData().getData();
                System.out.println(new String(data));
            }
        });
        // 3.开启监听,如果设置为true,则开启监听是,加载缓冲数据
        nodeCache.start(true);

        while (true){

        }
    }

    /**
     * 演示PathChildrenCache: 监听某个节点的所有子节点
     */
    @Test
    public void testPathChildrenCache() throws Exception{
        // 1.创建监听对象
        PathChildrenCache pathChildrenCache = new PathChildrenCache(client,"/app2",true);
        // 2.绑定监听器
        pathChildrenCache.getListenable().addListener(new PathChildrenCacheListener() {
            @Override
            public void childEvent(CuratorFramework curatorFramework, PathChildrenCacheEvent event) throws Exception {
                System.out.println("子节点变化了~");
                System.out.println(event);
                // 监听子节点的数据变更,并且拿到变更后的数据
                // 1.获取类型
                PathChildrenCacheEvent.Type type = event.getType();
                // 2.判断类型是否是update
                if (type.equals(PathChildrenCacheEvent.Type.CHILD_UPDATED)){
                    byte[] data = event.getData().getData();
                    System.out.println(new String(data));
                }
            }
        });
        // 3.开启
        pathChildrenCache.start();

        while (true){

        }
    }

    /**
     * 演示 TreeCache:监听某个节点自己和所有子节点
     * @throws Exception
     */
    @Test
    public void testTreeCache() throws Exception{
        //1.创建监听器
        TreeCache treeCache = new TreeCache(client,"/app2");
        //2.注册监听
        treeCache.getListenable().addListener(new TreeCacheListener() {
            @Override
            public void childEvent(CuratorFramework client, TreeCacheEvent event) throws Exception {
                System.out.println("节点变化了");
                System.out.println(event);
            }
        });
        //3.开启
        treeCache.start();
        while (true) {

        }
    }
}

分布式锁

  • 在我们进行单机应用开发,涉极并发同步的时候,我们往往采用synchronized或者Lock的方式来解决多线程间的代码同步问题,
    这时多线程的运行都是在同一个JVM之下,没有任何问题。
  • 但当我们的应用是分布式集群工作的情况下,属于多JVM下的工作环境,跨JVM之间已经无法通过多线程的锁解决同步问题。
  • 那么就需要一种更加高级的锁机制,来处理种跨机器的进程之间的数据同步问题一这就是分布式锁。

ZooKeeper分布式锁原理

  • 核心思想:当客户端要获取锁,则创建节点,使用完锁,则删除该节点。
  1. 客户端获取锁时,在lock节点下创建临时顺序节点。
  2. 然后获取lock下面的所有子节点,客户端获取到所有的子节点之后,如果发现自己创建的子节点序号最小,那么就认为该客户端获取到了锁,使用完锁之后,将该节点删除。
  3. 如果发现自己创建的节点并非ock所有子节点中最小的,说明自己还没有获取到锁,此时客户端需要找到比自己小的那个节点,同时对其注册事件监听器,监
    监听删除事件。
  4. 如果发现比自己小的那个节点被删除,则客户端的Watcher会收到相应通知,此时再次判断自己创建的节点是否是lock子节,点中序号最小的,如果是则获取到了锁,如果不是则重复以上步骤继续获取到此自己小的一个节点并注册监听。

Curator实现分布式锁API

  • 在Curator中有五种锁方案:
    • InterProcessSemaphoreMutex:分布式排它锁(非可重入锁)
    • InterProcessMutex:分布式可重入排它锁
    • InterProcessReadWriteLock:分布式读写锁
    • InterProcessMultiLock:将移个锁作为单个实体管理的容器
    • InterProcessSemaphoreV2:共享信号量

分布式锁案例-模拟12306售票

public class LockTest {
    public static void main(String[] args) {
        Ticket12306 ticket12306 = new Ticket12306();

        // 创建客户端
        Thread t1 = new Thread(ticket12306,"携程");
        Thread t2 = new Thread(ticket12306,"飞猪");

        t1.start();
        t2.start();
    }
}
public class Ticket12306 implements Runnable{

    private int tickets = 10; //数据库的票数

    private InterProcessMutex lock;

    public Ticket12306(){
        RetryPolicy retryPolicy = new ExponentialBackoffRetry(3000,10);
        CuratorFramework client = CuratorFrameworkFactory.builder()
                .connectString("8.130.113.49:2181")
                .sessionTimeoutMs(60 * 1000)
                .connectionTimeoutMs(15 * 1000)
                .retryPolicy(retryPolicy)
                .build();
        client.start();
        lock = new InterProcessMutex(client,"/lock");
    }

    @Override
    public void run() {
        while (true){
            // 获取锁
            try {
                lock.acquire(3, TimeUnit.SECONDS);
                if (tickets > 0){
                    System.out.println(Thread.currentThread() + ":" + tickets);
                    tickets--;
                }
            } catch (Exception e) {
                e.printStackTrace();
            }finally {
                // 释放锁
                try {
                    lock.release();
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
        }
    }
}

ZooKeeper集群搭建

Zookeeper集群介绍

Leader选举:

  • Serverid:服务器ID

    比如有三台服务器,编号分别是1,23。编号越大在选择算法中的权重越大。

  • Zxid:数据ID

    服务器中存放的最大数据ID.值越大说明数据越新,在选举算法中数据越新权重越大。

  • 在Leader选举的过程中,如果某台ZooKeeper获得了超过半数的选票,则此ZooKeeper就可以成为Leader了。

搭建Zookeeper集群

1.1搭建要求

真实的集群是需要部署在不同的服务器上的,但是在我们测试时同时启动很多个虚拟机内存会吃不消,所以我们通
常会搭建伪集群,也就是把所有的服务都搭建在-台虚拟机上,用端口进行区分。

我们这里要求搭建一个三个节 点的Zookeeper集群(伪集群)。

1.2准备工作

重新部署一台虚拟机作为我们搭建集群的测试服务器。

(1)安装JDK [此步骤省略]。

(2)Zookeeper压缩包.上传到服务器

(3)将Zookeeper解压,建立/usr/local/zookeeper-cluster目录,将解压后的Zookeeper复制到以下三个目录

/usr/local/zookeeper-custer/zookeeper-1
/usr/local/zookeeper-cluster/zookeeper-2
/usr/local/zookeeper-cluster/zookeeper-3

[root@localhost ~]# mkdir /usr/loca1/zookeeper-cluster
[root@localhost ~]# cp -r apache-zookeeper-3.5.6-bin/usr/1oca1/zookeeper 一
cluster /zookeeper -1
[root@localhost ~]# cp -r apache-zookeeper-3.5.6-bin/usr/1oca1/zookeeper 一
cluster /zookeeper -2
[root@localhost ~]# cp -r apache-zookeeper-3.5.6-bin/usr/1oca1/zookeeper -
cluster /zookeeper -3

(4)创建data目录,并且将conf下z00_ sample.cfg文件改名为z00.cfg

mkdir /usr/loca1/zookeeper -cluster/ zookeeper-1/data
mkdir /usr/loca1/zookeeper -cluster/zookeeper-2/data
mkdir /usr/loca1/zookeeper -cluster/zookeeper-3/data

mv /usr/1oca1/zookeeper -cluster /zookeeper-1/conf/zoo_ samp1e.cfg /usr/1oca1/zookeeper -
cluster /zookeeper-1/conf/zoo. cfg
mv /usr/1oca1/zookeeper -cluster /zookeeper -2/conf/zoo_ sample.cfg /usr/1oca1/zookeeper-
cluster / zookeeper-2/conf/zoo.cfg
mv /usr/1oca1/ zookeeper -cluster /zookeeper -3/conf/zoo_ sample.cfg /usr/1oca1/zookeeper -
cluster/zookeeper-3/conf/zoo.cfg

(5)配置每一个Zookeeper的dataDir和clientPort分别为2181 2182 2183

修改/usr/local/zookeeper-cluster/zookeeper-1/conf/zoo.cfg

vim /usr/1oca1/zookeeper-cluster/zookeeper-1/conf/zoo.cfg
cli entPort=2181
dataDir=/usr/1oca1/zookeeper-cluster/zookeeper-1/data

修改/usr/local/zookeeper-cluster/zookeeper-2/conf/zoo.cfg

vim /usr/1oca1/zookeeper-cluster/zookeeper-2/conf/zoo.cfg
clientPort=2182
dataDir=/usr/1oca1/zookeeper-cluster/zookeeper-2/data

修改/usr/local/zookeeper-cluster/zookeeper-3/conf/zoo.cfg

vim /usr/1oca1/zookeeper-cluster/zookeeper-3/conf/zoo.cfg
clientPort=2183
dataDir=/usr/1oca1/zookeeper-cluster/zookeeper-3/data

1.3配置集群

(1)在每个zookeeper的data目录下创建一个而yid文件,内容分别是1、2、3。这个文件就是记录每个服务器的ID

echo 1 >/usr/loca1/zookeeper-cluster/zookeeper-1/data/myid
echo 2 >/usr/1oca1/zookeeper-cluster/zookeeper-2/data/myid
echo 3 >/usr/1oca1/zookeeper-cluster/zookeeper-3/data/myid

(2)在每一个zookeeper的z00.cfg配置客户端访问端口(clientPort) 和集群服务器IP列表。

集群服务器IP列表如下

vim /usr/1oca1/zookeeper-cluster/zookeeper-1/conf/zoo.cfg
vim /usr/1oca1/zookeeper-cluster/zookeeper-2/conf/zoo.cfg
vim /usr/1oca1/zookeeper-cluster/zookeeper-3/conf/zoo.cfg
server.1=192.168.149.135:2881:3881
server.2=192.168.149.135:2882:3882
server.3=192.168.149.135:2883:3883

解释: server.服务器ID=服务器IP地址:服务器之间通信端口:服务器之间投票选举端口

1.4启动集群

启动集群就是分别启动每个实例。

/usr/1oca1/zookeeper-cluster/zookeeper-1/bin/zkServer.sh start
/usr/1oca1/zookeeper-cluster/zookeeper-2/bin/zkServer.sh start
/usr/1oca1/zookeeper-cluster/zookeeper-3/bin/zkServer.sh start

1.5模拟集群异常

(1)首先我们先测试如果是从服务器挂掉,会怎么样

把3号服务器停掉,观察1号和2号,发现状态并没有变化

/usr/1oca1/zookeeper-cluster/zookeeper-3/bin/zkServer.sh stop 
/usr/1oca1/zookeeper-cluster/zookeeper-1/bin/zkServer.sh status
/usr/1oca1/zookeeper-cluster/zookeeper-2/bin/zkServer.sh status

由此得出结论,3个节点的集群,从服务器挂掉,集群正常

(2)我们再把1号服务器(从服务器)也停掉,查看2号(主服务器)的状态,发现已经停止运行了。

/usr/1oca1/zookeeper-cluster/zookeeper-1/bin/zkServer.sh stop
/usr/1oca1/zookeeper-cluster/zookeeper-2/bin/zkServer.sh status

由此得出结论,3个节点的集群,2个从服务器都挂掉,主服务器也无法运行。因为可运行的机器没有超过集群总数量的半数。

(3)我们再次把1号服务器启动起来,发现2号服务器又开始正常工作了。而且依然是领导者。

/usr/loca1/zookeeper-cluster/zookeeper-1/bin/zkServer.sh start
/usr/loca1/zookeeper-cluster/zookeeper-2/bin/zkServer.sh status

(4)我们把3号服务器也启动起来,把2号服务器停掉,停掉后观察1号和3号的状态。

/usr/1oca1/zookeephr-cluster/zookeeper-2/bin/zkServer .sh stop
/usr/loca1/zookeeper-cluster/zookeeper-1/bin/zkServer .sh status

/usr/1oca1/zookeeper-cluster/zookeeper-3/bin/zkServer .sh status

发现新的leader产生了~

由此我们得出结论,当集群中的主服务器挂了,集群中的其他服务器会自动进行选举状态,然后产生新得leader

(5)我们再次测试,当我们把2号服务器重新启动起来启动后,会发生什么? 2号服务器会再次成为新的领导吗?

Zookeeper集群角色

在ZooKeeper集群服中务中有三个角色:

  • Leader领导者:

    ​ 1.处理事务请求

    ​ 2.集群内部各服务器的调度者

  • Follower跟随者:

    ​ 1.处理客户端非事务请求,转发事务请求给L eader服务器

    ​ 2.参与Leader选举投票

  • Observer观察者:

    处理客户端非事务请求,转发事务请求给Leader服务器


文章作者:
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 !
  目录