no xxx to stop

接触大数据集群就有时需要重启集群,在重启的时候经常会遇到no xxx to stop的问题,我的集群包括hadoop、hbase、spark,停止的时候都有此情况发生,原因是配置中有个xxx_PID_DIR参数,默认为/tmp,这个目录linux会定期清理,所以会找不到pid也就没办法正常停止,解决思路如下:
将hadoop、hbase、spark的家目录/sbin下的xxx-daemon.sh中,在usage=…下添加XXXX_PID_DIR=/var/xxx/pids保存退出,通过ssh分发至个节点相同位置。然后在各个节点运行mkdir -p /var/xxx/pids | chmod 777 /var/xxx/pids,并将残留的未关闭的进程kill掉,重启集群即可

猜你喜欢

转载自blog.csdn.net/github_37835908/article/details/77647810
xxx