记一次hadoop.tmp.dir配置因重启机器导致无法启动 - 代码天地

记一次hadoop.tmp.dir配置因重启机器导致无法启动

其他 2019-02-23 02:15:51 阅读次数: 0

缘由

线上一直运行的hadopp集群，突然有一天服务器断电重启，集群正常启动，但是spark on yarn上的任务无法提交，报错一提交任务AM就被kill掉。

解决方案

步骤一

在$HADOOP_HOME/etc/hadoop中的core-site.xml有个 hadoop.tmp.dir 配置的是Hadoop临时目录，比如HDFS的NameNode数据默认都存放这个目录下，查看*-default.xml 等默认配置文件，就可以看到很多依赖${hadoop.tmp.dir} 的配置。

默认的hadoop.tmp.dir 是/tmp/hadoop-${user.name} ,此时有个问题就是 NameNode 会将 HDFS 的元数据存储在这个/tmp目录下，如果操作系统重启了，系统会清空 /tmp 目录下的东西，导致NameNode元数据丢失，是个非常严重的问题，所有我们应该修改这个路径。

步骤二

如果需要重新格式化 NameNode，需要先将原来 NameNode 和 DataNode 下的文件全部删除，不然会报错，NameNode 和 DataNode 所在目录是在 core-site.xml中 hadoop.tmp.dir、 dfs.namenode.name.dir、 dfs.datanode.data.dir属性配置的。

步骤三

如果spark提交任务报错找不到类，可以查看$SPARK_HOME/conf目录下spark-defaults.conf是否添加了如下配置：

spark.yarn.jars=hdfs://xxx.xxx.xxx.xxx:9000/user/spark_jars/*

如果配置了，需要把jars包上穿传到hdfs指定位置

猜你喜欢

转载自blog.csdn.net/qq_23160237/article/details/86703604

记一次hadoop.tmp.dir配置因重启机器导致无法启动

hadoop修改hadoop.tmp.dir

记一次因硬盘故障导致的docker服务无法启动

hadoop的hadoop.tmp.dir安装时一定要更改

记一次phpstudy重启后Apache无法启动

记一次突然宕机重启服务器导致docker中redis无法启动的问题解决

记一次centos7.6因误删除python2.7.5导致yum软件无法使用

记一次 zookeeper连接地址值不对导致业务无法启动问题

记一次FreeRTOS错误配置导致无法进入临界区

记一次zabbix配置ODBC时由于mysql-connector-odbc驱动版本导致zabbix重启的问题

记一次因证书问题导致请求失败问题SSLHandshakeException

记一次因inode满载导致的web访问卡顿事件

记一次数据崩溃无法启动

记一次因权限问题无法删除hdfs文件的解决办法

记一次重启脚本的编写

记一次mysql 重启失败

【转载】记一次因 Redis 使用不当导致应用卡死 bug 的排查及解决！

记录一次因PHP的内存溢出导致的错误

记一次因坏块引起的dataguard恢复

Java 记一次因BOM编码标识的BUG

记一次由于Superblock崩溃导致的Linux无法开机修复过程

记一次Postgresql异常中断导致的启动失败

hadoop集群dfs.data.dir目录权限问题导致节点无法启动

记一次启动故障

记一次hadoop环境搭建中DataNode启动失败的问题！

Hadoop的data.dir配置导致balancer无法平衡各节点

记一次ZYNQ板卡无法启动问题的调试过程

记一次springcloud整合到项目中，无法启动，Failed to start bean 'eurekaAutoServiceRegistration'

记一次Sql Server (MSSQLSERVER) 服务无法启动处理经历

记一次Nessus无法启动问题--Corrupt Database

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)