Hadoop 学习笔记（一） - 代码天地

Hadoop 学习笔记（一）

企业开发 2018-05-13 10:51:31 阅读次数: 0

解决主要问题：海量数据存储（HDFS），分布式运算（Map Reduce）
存储单位——“Block”，每个块存3份
HDFS特点
水平扩展存储（运算）能力
数据备份
HDFS中主要角色：
Namenode（负责协调）
Datanode（负责干活）

map reduce是一种数据处理的编程模型，下面两个例子将说明它的处理过程：
一、SHELL命令举例：
ls | grep 2008 #查询文件名包含2008的文件
ls | grep 2008 | wc -l #计算上述指令查询文件个数

二、SQL举例：
select * from device t where t.name like 'CNC-Bj%'
select count(*) from device t where t.name like 'CNC-Bj%

前一个动作是map 后一个动作是reduce

Map reduce 框架包含两个程序：
Jobtracker（Job协调）
Tasktracker（干活）
不足：小文件
namenode小文件问题，大量小文件会导致其内存溢出，mapreduce job运行效率低下

猜你喜欢

转载自hbjava1985.iteye.com/blog/1942325

hadoop学习笔记（一）

Hadoop 学习笔记（一）

Hadoop学习笔记一

Hadoop学习笔记 (一)

hadoop学习笔记一

Hadoop学习笔记(一)

hadoop学习笔记<一>----hadoop简介

hadoop学习笔记之一：初识hadoop

hadoop学习笔记（一）：hadoop集群搭建

Apache Hadoop学习笔记一

Hadoop基础学习笔记一

Hadoop学习笔记_初识Hadoop

【Hadoop学习笔记】——Hadoop基础

Hadoop学习笔记-Hadoop初识

Hadoop学习一：Hadoop版本

hadoop学习（一）---hadoop简介

Hadoop学习笔记(一) Hello, World

hadoop学习笔记(一)——java动态代理

Hadoop系列之学习笔记（一）

《Hadoop权威指南》学习笔记（一）

大数据Hadoop学习笔记（一）

学习笔记(一)-----Hadoop集群规划及部署

大数据学习笔记（一）：Hadoop

大数据学习笔记(一)_Hadoop简述

hadoop学习笔记（一）——hadoop运行源代码分析

Hadoop学习笔记之一:Hadoop项目简介

hadoop学习笔记之一：hadoop生态系统

hadoop学习笔记之一：hadoop生态系统

Hadoop学习笔记（一）：Hadoop及大数据基本了解

Hadoop笔记 - Hadoop的组成

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)