Spark入门到精通（入门）——第二节 Spark 2.0.0 查看job 历史日志

其他 2018-10-09 07:24:02 阅读次数: 0

版权声明：所有内容原创，如需转载，请声明 https://blog.csdn.net/lovedopa/article/details/82943234

本文十分的重要，希望对大家的spark学习有一些帮助：

1 引言：

在使用Spark的时候，有时候我们会关注job的历史日志，但是在Spark中默认情况下，历史日志是关闭的，在本篇博客中主要介绍一下如何启动spark的历史日志。

2 开启历史日志服务器

2.1 安装spark

参考

spark简介和安装

2.2 修改配置文件

1修改spark-default.conf

修改后的结果如图所示

spark.eventLog.enabled true

spark.eventLog.dir hdfs://linux102:9001/spark/jobhistory/logs

spark.eventLog.compress true

当然，：HDFS上的目录需要提前存在

2 修改spark-env.sh文件

spark-env.sh

export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=4000

-Dspark.history.retainedApplications=5

-Dspark.history.fs.logDirectory=hdfs://linux102:9001/spark/jobhistory/logs

3 参数描述：

spark.eventLog.dir：Application在运行过程中所有的信息均记录在该属性指定的路径下；
spark.history.ui.port=4000 调整WEBUI访问的端口号为4000
spark.history.fs.logDirectory=hdfs://linux102:9001/directory 配置了该属性后，在start-history-server.sh时就无需再显式的指定路径，Spark History Server页面只展示该指定路径下的信息
注意：我这里修改了hdfs的端口号
spark.history.retainedApplications=3 指定保存Application历史记录的个数，如果超过这个值，旧的应用程序信息将被删除，这个是内存中的应用数，而不是页面上显示的应用数。

4 测试

将配置好的Spark文件拷贝到其他节点上
/opt/module/spark/sbin/start-all.sh

启动后执行：【别忘了启动HDFS】
/opt/module/spark/sbin/start-history-server.sh

到此为止，Spark History Server安装完毕.
如果遇到Hadoop HDFS的写入权限问题：
org.apache.hadoop.security.AccessControlException
解决方案：在hdfs-site.xml中添加如下配置，关闭权限验证
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>

5 当我们退出job，如果显示

就表示安装成功了

猜你喜欢

转载自blog.csdn.net/lovedopa/article/details/82943234

Spark入门到精通（入门）——第二节 Spark 2.0.0 查看job 历史日志

spark 查看 job history 日志

Spark2.0.0源码编译

基于Spark 2.0.0搭建Hive on Spark环境

Spark - 使用Yarn管理器开启历史日志服务、查看日志

查看spark yarn日志

spark 2.0.0集群安装与hive on spark配置 Spark2.0.0源码编译

SPARK启动历史任务查看

spark查看历史任务的信息

spark2.0.0发布

【spark】一 spark on yarn的日志查看

Spark on Yarn查看删除日志

spark on yarn cluster查看日志

Spark快速入门系列(5) | Spark环境搭建—standalone(2) 配置历史日志服务器

Springboot（2.0.0.RELEASE）+spark（2.1.0）框架整合（原创）！！！

spark 历史和实时任务日志监控

Spark on Yarn模式下历史日志配置记录

Spark Streaming:从入门到精通(二)[原理]

Spark整合YARN报错或无法查看日志

Spark SQL:从入门到精通(二)[IDEA开发Spark SQL]

Spark on Yarn ｜ Spark，从入门到精通

Hello Spark! | Spark，从入门到精通

Spark SQL｜Spark，从入门到精通

Spark Streaming （一）| Spark，从入门到精通

【yarn】job日志查看

Spark Core快速入门系列(7) | Spark Job 的划分

Spark Core快速入门系列(5) | Spark中job的划分

Spark从入门到精通（一）

最新《Spark从入门到精通》

Spark SQL从入门到精通

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)