hadoop配置集群常见问题

1)防火墙没关闭、或者没有启动 yarn

INFO client.RMProxy: Connecting to ResourceManager at hadoop108/192.168.10.108:8032

2)主机名称配置错误

3)ip 地址配置错误

4)ssh 没有配置好

5)root 用户和 hadoop 两个用户启动集群不统一

6)配置文件修改不细心

7)未编译源码

Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 17/05/22 15:38:58 INFO client.RMProxy: Connecting to ResourceManager at hadoop108/192.168.10.108:8032

8)datanode 不被 namenode 识别问题
    Namenode 在 format 初始化的时候会形成两个标识,blockPoolId 和 clusterId。新的datanode 加入时,会获取这两个标识作为自己工作目录中的标识。一旦 namenode 重新 format 后,namenode 的身份标识已变,而 datanode 如果依然持有原来的 id,就不会被 namenode 识别。
    解决办法,删除 datanode 节点中的数据后,再次重新格式化 namenode。

9)不识别主机名称

java.net.UnknownHostException: node1: node1
 at java.net.InetAddress.getLocalHost(InetAddress.java:1475)
 at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:146)
 at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1290)
 at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1287)
 at java.security.AccessController.doPrivileged(Native Method)
 at javax.security.auth.Subject.doAs(Subject.java:415)

    解决办法:
    (1)在/etc/hosts 文件中添加 192.168.0.241 node1
    (2)主机名称不要起 hadoop hadoop000 等特殊名称

10)datanode 和 namenode 进程同时只能工作一个。
问题分析
11)执行命令不生效,粘贴 word 中命令时,遇到-和长–没区分开,导致命令失效
解决办法:尽量不要粘贴 word 中代码,可以先粘贴到记事本中再复制粘贴。

12)jps 发现进程已经没有,但是重新启动集群,提示进程已经开启。原因是在 linux 的根目录下/tmp 目录中存在启动的进程临时文件,将集群相关进程删除掉,再重新启动集群。

猜你喜欢

转载自blog.csdn.net/qq_36885128/article/details/88068249