大数据技术原理与应用：【第二讲】大数据处理架构Hadoop - 代码天地

大数据技术原理与应用：【第二讲】大数据处理架构Hadoop

其他 2019-06-08 18:01:45 阅读次数: 0

2.1 Hadoop概论

创始人：Doug Cutting

1.简介：

开源免费;

操作简单，极大降低使用的复杂性;

Hadoop是Java开发的;

在Hadoop上开发应用支持多种编程语言、不限于Java；

Hadoop两大核心：HDFS+MapReduce

HDFS：海量数据存储

MapReduce：海量数据的处理

2.起源：

原本是文本搜索库，模仿谷歌的搜索引擎；

融入了谷歌相关技术：分布式文件系统GFS；分布式并行编程框架MapReduce；

3.成名史：数据排序的傲人成绩

4.特性：

1.高可靠性

2.高效性

3高可扩展性

4.高容错性

5.低成本

6.运行在Linux平台上

7.支持多种编程语言

5.应用现状：

例如：Facebook

2.2 Hadoop项目结构

HDFS：分布式文件存储

MapReduce：数据处理，基于磁盘

Spark（性能比MapReduce高一个数量级）：数据处理，基于内存

Hive：数据仓库；做决策分析；支持SQL语句（把SQL语句转成MapReduce作业，再去执行）；

Pig：流数据处理，轻量级数据；提供类似SQL的查询语句Pig Latin；

Oozie:作业流调度系统

Zookeeper:分布式协调服务；分布式锁；集群管理；

HBase：列族数据库，随机读写

Flume：日志收集

Sqoop：数据导入导出，关系型数据库到HDFS、HBase、Hive互导

Ambari：快速部署工具

2.3 Hadoop安装与使用

1.Linux选择：

选择Linux版本：Ubuntu

内存选择：看电脑。内存大于4G，选择64位

2.系统安装虚拟机还是双系统：

看电脑配置

电脑比较新，装虚拟机

3.关于Linux基础知识

1.Shell：命令解析器

2.sudo命令：权限管理机制，管理员可以授权普通用户去执行一些需要root权限执行的操作

3.输入密码：看不见自己输入的密码

4.输入法中英文切换：使用“shift”键

5.Ubuntu终端赋值黏贴快捷键：ctrl+shift+V

4.安装方式：

单机模式，伪分布式模式，分布式模式

5.创建虚拟机：

1.材料与工具：虚拟机软件与系统映像文件

2.确认系统版本：

2.4 Hadoop集群的部署与使用

考虑HDFS和MapReduce

（后补）

慕课链接：https://www.icourse163.org/learn/XMU-1002335004?tid=1003965001#/learn/content

猜你喜欢

转载自www.cnblogs.com/musecho/p/10991177.html

大数据技术原理与应用：【第二讲】大数据处理架构Hadoop

《大数据技术应用与原理》第二版-第二章大数据处理架构Hadoop

大数据技术原理与应用第二章大数据处理架构Hadoop 学习指南

大数据技术原理与应用——大数据处理架构Hadoop

大数据技术原理与应用之【大数据处理架构Hadoop】习题

大数据技术原理与应用——大数据处理架构 Hadoop

第二章：大数据处理架构Hadoop

二、Hadoop大数据处理架构

大数据技术与架构——（二）大数据处理架构Hadoop（上）

大数据技术原理与应用第三篇大数据处理与分析 (二) Hadoop再探讨

第二章-大数据处理框Hadoop

大数据处理架构Hadoop

大数据处理架构Hadoop理解

大数据处理技术与应用

大数据技术原理与应用第三篇大数据处理与分析（三）Spark

大数据技术原理与应用第三篇大数据处理与分析 (一) MapReduce

Hadoop1-认识Hadoop大数据处理架构

大数据处理技术之Hadoop——初识Hadoop

大数据处理架构

大数据处理技术架构（基于hadoop和OpenStack）2019

专注于Scala语言、Hadoop及Spark大数据处理技术

大数据学习2——大数据处理架构Hadoop概述

《大数据技术原理与应用》第二版-第八章Hadoop再探讨

大数据处理应用及核心技术解读

大数据处理的关键技术及应用

spark大数据处理技术、应用与性能优化

hadoop大数据处理平台与案例

hadoop大数据处理工具

搭建Hadoop大数据处理-环境

大数据技术原理与应用入门（二）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)