大数据环境搭建--zookeeper

Zookeeper的环境配置
HBase做集群,所以就需要zookeeper了

将下载下来的Zookeeper 的配置文件进行解压

tar  -xvf   zookeeper-3.4.6.tar.gz

然后移动到/app/hadoop/目录下(根据自身情况选择)

mv  zookeeper-3.4.10  /app/hadoop

创建目录

mkdir   /app/hadoop/zookeeper-3.4.10/data  
mkdir   /app/hadoop/zookeeper-3.4.10/dataLog

进入data目录创建myid文件 将hadoop1、hadoop2、hadoop3的myid文件内容改为1,2,3

cd /app/hadoop/zookeeper-3.4.10/data 
touch  myid
vim myid
1

这个myid 不同服务器不同 1,2,3
和配置文件中一一对应

conf 目录下新建zoo.cfg

cd /app/hadoop/zookeeper-3.4.10/conf
mv zoo_sample.cfg zoo.cfg
vim zoo.cfg

添加如下配置

dataDir=/app/hadoop/zookeeper-3.4.6/data
dataLogDir=/app/hadoop/zookeeper-3.4.6/dataLog
server.1=hadoop1:2888:3888
server.2=hadoop2:2888:3888
server.3=hadoop3:2888:3888

这里server.1 的1是和上面的myid对应
注:因为之前1服务器始终启动不成功,修改成4 正常启动
报错Have smaller server identifier, so dropping the connection: (2, 1)

说明:client port,顾名思义,就是客户端连接zookeeper服务的端口。这是一个TCP port。dataLogDir里是放到的顺序日志(WAL)。而dataDir里放的是内存数据结构的snapshot,便于快速恢复。为了达到性能最大化,一般建议把dataDir和dataLogDir分到不同的磁盘上,这样就可以充分利用磁盘顺序写的特性。dataDir和dataLogDir需要自己创建,目录可以自己制定,对应即可。server.1中的这个1需要和master这个机器上的dataDir目录中的myid文件中的数值对应。server.2中的这个2需要和slave1这个机器上的dataDir目录中的myid文件中的数值对应。server.3中的这个3需要和slave2这个机器上的dataDir目录中的myid文件中的数值对应。当然,数值你可以随便用,只要对应即可。2888和3888的端口号也可以随便用,因为在不同机器上,用成一样也无所谓。
1.tickTime:CS通信心跳数
Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。tickTime以毫秒为单位。
tickTime=2000
2.initLimit:LF初始通信时限
集群中的follower服务器(F)与leader服务器(L)之间初始连接时能容忍的最多心跳数(tickTime的数量)。
initLimit=10
3.syncLimit:LF同步通信时限
集群中的follower服务器与leader服务器之间请求和应答之间能容忍的最多心跳数(tickTime的数量)。
syncLimit=5

依旧将zookeeper传输到其他的机器上,记得更改 /opt/zookeeper/data 下的myid,与配置文件中相同。
输入:

scp -r /app/hadoop/zoo/app/hadoop/zookeeper-3.4.6 root@slave1:/app/hadoop

启动、查看状态

zkServer.sh start
zkServer.sh status
发布了31 篇原创文章 · 获赞 11 · 访问量 6446

猜你喜欢

转载自blog.csdn.net/cyz52/article/details/103553876