MapReduce特性(四) 边数据分布 - 代码天地

MapReduce特性(四) 边数据分布

其他 2018-06-30 05:09:57 阅读次数: 2

边数据：作业所需的额外的只读数据，辅助处理主数据集

1 JobConf

> Configuration类的setter方法

> Context.getConfiguration()

> 如果是复杂的元数据，用户自定义序列化或者使用Stringifier类

2 分布式缓存

分布式缓存优于序列化边数据

工作机制

> 用户启动作业，Hadoop使用-files -archives -libjars等选项将指定文件复制到分布式文件系统中

> 任务运行前，NM将文件从DFS复制到本地磁盘使任务访问，此时文件本地化

> 文件以符号链接的方式指向任务工作目录

> -libjars指定的文件会在任务执行前添加到任务的classpath

> NM使用Counter统计文件使用情况

> 缓存容量过高时，LRU删除文件

> yarn-nodemanager.localizer.cache.target-size-mb设置缓存大小，默认10GB

工具GenericOptionsParser

-files 指定分发的文件，包含逗号隔开的URI列表

-archives 复制存档文件

-libjars 将JAR文件添加到classpath

hadoop jar hadoop-examples.jar\
MaxTemperatureByStationNameUsingDistributedCacheFile \
-files input/ncdc/metadata/stations-fixed-width.txt input/ncdc.all output

将本地文件statioins-fixed-width.txt复制到任务节点

分布式缓存API

Job API

addCacheXXXX()
setCacheXXXX()
addXXXXToClassPath()

猜你喜欢

转载自blog.csdn.net/weixin_42129080/article/details/80811376

MapReduce特性(四) 边数据分布

MapReduce-边数据

大数据(四) - MapReduce

大数据之Hadoop（四）：分布式处理框架 MapReduce、MapReduce编程模型

MapReduce分布式计算(四)

大数据学习笔记(四)_MapReduce分布式处理框架

hadoop学习（四）MapReduce分布式计算利器

MapReduce的特性

MapReduce 特性（ MapReduce Features ）

Hadoop大数据开发基础系列：四、MapReduce初级编程

大数据开发复习第四篇（MapReduce篇）

大数据技术之Hadoop学习(四)——MapReduce

数据库事物的四特性

数据库四大特性

ElasticSearch学习总结（四）：分布式特性

MapReduce(四)

Hadoop MapReduce的特性

大数据(八) --分布式计算框架(MapReduce)

大数据技术之分布式运算程序MapReduce

【大数据Hadoop系列】分布式计算框架——MapReduce

大数据之Hadoop分布式计算框架MapReduce

数据库的四大特性及事务的隔离级别

数据库事务的四大特性

数据库的事务及其四大特性

数据库事物的四个特性

数据库事务四大特性

数据库原理之------事务四大特性

数据仓库具有四个主要特性

数据库的四大特性及事务

数据库事务的四大特性：ACID

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)