Hadoop及spark集群搭建踩过的坑 - 代码天地

Hadoop及spark集群搭建踩过的坑

其他 2018-11-25 21:00:04 阅读次数: 0

本集群总共有三台主机，一台master，两台slave

Hadoop有一个节点无法启动

在按照教程子雨大数据之Spark入门教程(Python版)搭建Hadoop集群时，运行jps命令，发现master和其中一个slave能正常工作，运行./bin/yarn node -list发现只有一个alive节点

再次申明：本文只是针对搭建集群中有一个节点无法启动，而不是所有的节点

进一步观察，发现运行jps命令后，未启动节点的nodemanager不能正常启动

根据网上相关的建议在datanode上查看log文件（文件会在启动Hadoop集群时显示其所在目录），发现datanode连接不到主机，进一步查看其连接的主机IP地址，发现同伴将主机IP地址写错了\吐血

将host文件主机的IP地址改正后，重启即可正常运行

Incompatible clusterIDs in /usr/local/hadoop/tmp/dfs/data

这个错误出现了两次

第一次是同伴在第一次运行hadoop时，根据上述教程运行了bin/hdfs namenode -format这个命令

还有一次是另一个同伴将从节点关机重启后，master的clusterID就和slaves的不一样了。

解决方式有两种：

第一种：把配置文件hdfs.site.xml中dfs.datanode.data.dir在本地系统的路径下的current/VERSION（一般$HADOOP/tmp/dfs/data/current文件夹下）中的clusterID改为与namenode一样。重启即可！

第二种：重装一遍hadoop集群，删除tmp和log文件夹后重新向slaves节点发送一遍hadoop文件夹

注意：这会删除HDFS中原有的所有数据，慎重使用

Exception: Python in worker has different version 3.4 than that in driver 3.5, PySpark cannot run with different minor versions.Please check environment variables PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON are correctly set

问题原因：如上图所示，spark会在每个worker节点上运行python程序，所以要保证每个worker节点上python版本一致

解决方式：

import os

os.environ["PYSPARK_PYTHON"] = /usr/bin/python3.5

there appears to be a gap in the edit log. we expected txitd 1, but got txid 2070

根据网上经验来看，最后那串数字有很多种，但是感觉应该都能用同一种方法

原因：namenode元数据被破坏，需要修复

恢复一下namenode

hadoop namenode –recover 先选择Y，再选择c，然后再重启一遍hadoop

猜你喜欢

转载自blog.csdn.net/intersting/article/details/82979950

Hadoop及spark集群搭建踩过的坑

spark踩过的坑

搭建hadoop完全分布式集群时踩过的坑

hadoop集群搭建踩坑记录

spark本地提交集群运行踩过的坑

windows 搭建和配置 hadoop + 踩过的坑

搭建Hadoop报错汇总（那些曾经踩过的坑）

安装Spark+hadoop，spark、hadoop分布式集群搭建...(亲自搭建过！！)

ELK搭建踩过的坑

搭建GithubPages踩过的坑

spark streaming 踩过的那些坑

（二）RabbitMQ 普通集群 & 镜像集群搭建（含踩过的坑......）

redis集群部署及踩过的坑

redis集群安装踩过的坑

Redis 集群部署及踩过的坑

Redis 集群时踩过的坑

记录博客搭建踩过的坑

搭建wordpress所踩过的坑

Hadoop、Spark 集群环境搭建

hadoop-spark集群搭建

hadoop&spark集群搭建

hadoop及spark集群搭建后续

hadoop+spark集群搭建

基于Hadoop的Spark集群搭建

hadoop集群配置踩坑实录

【Spark】IDEAL 踩过的坑 —— 参数无法识别

[坑况]——webpack搭建前端环境踩过的坑啊

安装Hadoop伪分布式踩过的坑

redis集群搭建踩坑笔记

rabbitmq高可用集群搭建踩坑

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)