余老师带你学习大数据-Spark快速大数据处理第七章第一节Oozie总体介绍

其他 2021-01-26 07:50:15 阅读次数: 0

Oozie是解决工作流，特别是大数据处理工作流的任务框架。

工作流的必要性

第一点是在大数据处理中需要创建端到端的应用，经常处理一些定时、调度、shell脚本将流程化的节点串接在一起，如果使用传统的方式也就是脚本，但是效率比较底下，无法可视化的对脚本处理，以及相应的脚本的错误处理、通知、其他的监控通知无法做到自动化，而且不同的步骤之间的逻辑以及精细化的调度也很难做精细化的处理。所以说，我们需要在大数据工作流引擎，去支撑这种应用。
第二点如果自己做一些Spark脚本，需要通过一系列的提交，这个工作效率是非常低的。之所以为什么不模拟Spark客户端去提交信息，是因为数据处理任务仅仅是写一个处理函数，相关的步骤框架是通过Oozie满足的。这也是大数据工作引入的必须的条件。Oozie是针对大数据处理的调度器，还要适合于现有的大数据处理框架的功能。

Oozie基本概念

在这里插入图片描述

基本架构是Oozie客户端（命令行或REST接口）去提交job，给Oozie服务器，通过服务器中的调度器去调度job在Hadoop上执行，因此在Oozie上有一个做相应大数据的库。此外还有一个针对工作流引擎的数据库，存储工作流细节，这是关系型的数据库。
右侧是客户端提交任务的详细情况，客户端将job上传到HDFS上，集群上的所有节点能够通过HDFS下载job的详细信息，之后，job被提交到yarn集群上，MR，Hive，Pig，Java，Shell，Sqoop，SSH做支撑。

Oozie流程

在这里插入图片描述

详细学习内容可观看Spark快速大数据处理扫一扫~~~或者引擎搜索Spark余海峰

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_45810046/article/details/109767024

余老师带你学习大数据-Spark快速大数据处理第七章第一节Oozie总体介绍

余老师带你学习大数据-Spark快速大数据处理第一章第一节课程总体介绍

余老师带你学习大数据-Spark快速大数据处理第六章第一节Spark总体介绍

余老师带你学习大数据-Spark快速大数据处理第二章第一节Zookeeper总体介绍

余老师带你学习大数据-Spark快速大数据处理第五章第一节Hive总体介绍

余老师带你学习大数据-Spark快速大数据处理第四章第一节Tez总体介绍

余老师带你学习大数据-Spark快速大数据处理第七章第二节Oozie环境搭建

余老师带你学习大数据-Spark快速大数据处理第七章第三节Oozie案例

余老师带你学习大数据-Spark快速大数据处理第十章Kafka第一节了解Kafka

余老师带你学习大数据-Spark快速大数据处理第九章HBase第一节深刻了解HBase

余老师带你学习大数据-Spark快速大数据处理第三章第一节Hadoop集群搭建概要

余老师带你学习大数据-Spark快速大数据处理第八章第一节案例数据源介绍

余老师带你学习大数据-Spark快速大数据处理第三章第七节MR内部机制调优

余老师带你学习大数据-Spark快速大数据处理第十章Kafka第七节Kafka-Stream

余老师带你学习大数据框架全栈第十二章第一节第一章Flume 概述

余老师带你学习大数据-Spark快速大数据处理第三章第十一节YARN调度器和实战编写

余老师带你学习大数据-Spark快速大数据处理第六章第四节Spark案例

余老师带你学习大数据-Spark快速大数据处理第六章第三节Spark环境搭建

余老师带你学习大数据-Spark快速大数据处理第五章第四节HiveQL数据定义

余老师带你学习大数据-Spark快速大数据处理

余老师带你学习大数据-Spark快速大数据处理第三章第五节Federation操作

余老师带你学习大数据-Spark快速大数据处理第三章第三节HDFS基本操作

余老师带你学习大数据-Spark快速大数据处理第三章第六节MR基本用例WordCount

余老师带你学习大数据-Spark快速大数据处理第三章第二节Hadoop环境搭建

余老师带你学习大数据-Spark快速大数据处理第二章第三节zookeeper客户端基本操作

余老师带你学习大数据-Spark快速大数据处理第二章第五节zookeeper主从应用

余老师带你学习大数据-Spark快速大数据处理第二章第四节zookeeper分布式锁

余老师带你学习大数据-Spark快速大数据处理第二章第二节ZooKeeper环境搭建

余老师带你学习大数据-Spark快速大数据处理第九章HBase第三节HBase表操作

余老师带你学习大数据-Spark快速大数据处理第九章HBase第二节HBase环境搭建

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)