Hadoop离线项目 - 代码天地

Hadoop离线项目

其他 2019-04-05 11:10:54 阅读次数: 0

离线项目下的Hadoop生态栈
Hadoop生态离线项目
Hadoop：（无论什么大数据项目Hadoop是少不了的）
HDFS MapReduce(主要是做清洗) YARN （大数据项目基本都是跑在yarn资源框架上）
Hadoop集群
Hive：（主要是做计算）
外部表（会使用）
SQL （会使用）
数据倾斜（会遇到的问题）
优化
基于元数据管理（需要拿到元数据管理）
SQL ==> MapReduce （hive不仅仅是写sql，重要的是给一个sql语句如何分析生成的stage）
Flume
调度：（作业的调度）
crontab、shell
Azkaban
HUE：可视化的notebook CM
主要用于排查数据（相对于命令行形式来讲非常方便）

项目：通用
集群规模==>每台机器的配置==>机型

离线处理架构
在这里插入图片描述

流程及注意点
1、采集数据，server主要通过Flume,关系型数据库可以通过spoop或者spark采集
2、以天级别来分log文件的；支持各种文本格式
3、清洗过后的数据一般都是落在hive之上；ETL（mapreduce）出来之后是一个分区表
4、数据清洗之后移动数据到数仓，一定要刷元数据信息，才能在hue等工具上展示数据

猜你喜欢

转载自blog.csdn.net/weixin_43212365/article/details/88999670

Hadoop离线项目

Hadoop离线项目之数据清洗

基于Hadoop离线大数据分析平台项目实战

hadoop离线计算项目上线配置问题记录

基于Hadoop离线大数据分析平台项目实战|Hadoop视频教程

hadoop离线（Hadoop&HDFS）

hadoop之基于某电商离线处理项目架构和实现二（ETL数据清洗）

离线数仓-项目组件安装(Hadoop、Zookeeper、Kafka、Flume、Sqoop、Hive、Hbase)

Cloudera-hadoop 离线安装

maven项目离线开发

hadoop学习之CDH离线安装

hadoop离线数据存储和挖掘架构

使用ambari离线安装Hadoop集群

大数据离线-Hadoop入门（上）

hadoop离线计算与 storm实时计算

hadoop离线数据处理架构

离线计算系统之Hadoop入门

【Hadoop离线基础总结】MapReduce增强（下）

【Hadoop离线基础总结】MapReduce增强（上）

【Hadoop离线基础总结】MapReduce入门

【Hadoop离线基础总结】HDFS的API操作

【Hadoop离线基础总结】HDFS详细介绍

【Hadoop离线基础总结】HDFS入门介绍

【Hadoop离线基础总结】linux的shell编程

【Hadoop离线基础总结】linux基础增强

Hadoop离线计算——环境搭建（一）

【Hadoop技术】【离线分析系统结构概述】

hadoop离线分析（简单版）-windows整合

大数据离线阶段02：Apache Hadoop

【Hadoop离线基础总结】Hadoop的架构模型

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

第五讲：AbstractBean以及Ioc常见注解使用和自动装配

python-re模块学习-正则表达式

黑客攻击常用手段

正则表达式的规则

windwos::mutex

Spring中日志的使用（log4j）

Bootstra5 按钮处理

JVM内存结构-这一篇全部了解

Android的低级错误

Oracle中Cursor, A表a1字段值复制到B表b1字段

每日归档

更多

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)