创建用户
一般我倾向于把需要启动daemon进程,对外提供服务的程序,即服务器类的程序,安装在单独的用户下面。这样可以做到隔离,运维方面,安全性也提高了。
创建一个新的group,
$sudogroupaddzookeeper
创建一个新的用户,并加入group,
$sudouseradd-gzookeeperzookeeper
给新用户设置密码,
$sudopasswdzookeeper
1.单机模式(Standalonemode)
单机模式
单机模式在开发和调试阶段很有用。
1.1下载,解压
$wgethttp://mirror.bit.edu.cn/apache/zookeeper/zookeeper-3.4.5/zookeeper-3.4.5.tar.gz
$tarzxfzookeeper-3.4.5.tar.gz-C~/local/opt
1.2启动
默认就是单机模式,
$mvconf/zoo_sample.cfgconf/zoo.cfg
$./bin/zdServer.shstart
1.3使用java客户端连接ZooKeeper
$./bin/zkCli.sh-server127.0.0.1:2181
然后就可以使用各种命令了,跟文件操作命令很类似,输入help可以看到所有命令。
1.4关闭
$./bin/zdServer.shstop
2 分布式模式(Replicatedmode)
在生产环境中,要配置成分布式模式,才能发挥威力。
ZooKeeper集群一般被称为ZooKeeperensemble,或者quorum.
2.1准备3台机器
假设有三台机器,hostname和ip对应关系是:
192.168.40.107hadoop107
192.168.40.104hadoop104
192.168.40.108hadoop108
ZooKeeper不存在明显的master/slave关系,各个节点都是服务器,leader挂了,会立马从follower中选举一个出来作为leader.
由于没有主从关系,也不用配置SSH无密码登录了,各个zk服务器是自己启动的,互相之间通过TCP端口来交换数据。
2.2修改hadoop107的配置文件conf/zoo.cfg
tickTime=2000initLimit=10syncLimit=5dataDir=/root/hadoop/zookeeper-3.4.6/zookeeperdatadir/data dataLogDir=/root/hadoop/zookeeper-3.4.6/zookeeperdatadir/logs clientPort=2181server.1=hadoop107:2888:3888server.2=hadoop104:2888:3888server.3=hadoop108:2888:3888
修改完后拷贝到hadoop104,以及hadoop108上
2.3myid文件
要在每台机器的dataDir下,新建一个myid文件,里面存放一个数字,用来标识当前主机。
hadoop107:$echo"1" >> /root/hadoop/zookeeper-3.4.6/zookeeperdatadir/data/myid
hadoop104:$echo"2" >> /root/hadoop/zookeeper-3.4.6/zookeeperdatadir/data/myid
hadoop108:$echo"3" >> /root/hadoop/zookeeper-3.4.6/zookeeperdatadir/data/myid
2.4启动每台机器
hadoop107:$ zookeeper-3.4.6/bin/zkServer.sh
:$ zookeeper-3.4.6/bin/zkServer.sh
:$ zookeeper-3.4.6/bin/zkServer.shstart
因为3个节点的启动是有顺序的,所以在陆续启动三个节点的时候,前面先启动的节点连接未启动的节点的时候会报出一些错误。可以忽略。
2.5查看状态
$ zookeeper-3.4.6/bin/zkServer.shstatus
hadoop107的状态
hadoop104的状态
3使用java客户端连接ZooKeeper集群
找一台机器,解压zookeeper压缩包,不用配置,就可以使用java客户端连接ZooKeeper集群中的任意一台服务器了。
$./bin/zkCli.sh-serverhadoop104:2181