hadoop脑裂

今天修改了和journalNode通信的zookeeper配置,原来没有打开动态清理快照的功能。

所以3台zookeeper节点,每台修改完配置后,然后重启了下zookeeper服务。

然后就发现hadoop集群发生脑裂了,并且两台namenode节点都是standby状态。

经过半小时的激烈斗争,终于解决了。

以下是解决方案:

1. 停止3个journalNode,停止3台zookeeper服务。(这里会导致由于namenode与journalNode无法正常通信,而中断服务)

2. 重启3台zookeeper服务,重启3个journalNode服务。

3. 由于1的操作导致namenode服务停止,所以还需要手工启动namenode服务。

最后问题是解决了,但是这不是最好的方法,

在namenode服务停止后,任何连接的程序都将无法进行操作。

猜你喜欢

转载自www.cnblogs.com/30go/p/9233957.html