Hadoop学习笔记--DistributedCache

其他 2018-06-19 17:43:11 阅读次数: 2

mapreduce api的不同版本对于实现DistributedCache略有差异。

1.DistributedCache.addCacheFile(new URI("文件在HDFS中的位置"), conf);

这里需要注意：首先，conf指Configuration；其次，这句话必须写在Job job=new Job(conf,"作业名")之前！！

2.Path[] files=DistributedCache.getLocalCacheFiles(context.getConfiguration());

获得此Configuration的所有缓存文件本地地址，我们不需要管本地地址是什么，拿来用就行了。（最后解释原理）

这里有个大坑：getLocalCacheFiles返回的是本地副本的地址，而getCacheFiles返回的是HDFS文件地址，所以普通Java I/O是读不到的！

多说一句，旧版api使用JobConf获得缓存文件。

3.使用各个文件的地址读写文件即可，即基本java I/O

DistributedCache原理：

所谓缓存，就是将HDFS上的文件下载备份到各个节点供本地使用，也因此，修改本地文件是没有意义的（它只是一个副本）。

猜你喜欢

转载自blog.csdn.net/xqz583722585/article/details/80481149

Hadoop学习笔记--DistributedCache

DistributedCache In Hadoop

Hadoop DistributedCache

hadoop学习3——DistributedCache加载本地库

hadoop学习2——DistributedCache的部分用法

Hadoop DistributedCache详解

Hadoop分布式缓存(DistributedCache)

Hadoop 2.x的DistributedCache无法工作的问题

Hadoop入门(10)--分布式缓存DistributedCache

Hadoop 之分布式缓存的原理和方法——DistributedCache

Hadoop学习笔记_初识Hadoop

【Hadoop学习笔记】——Hadoop基础

Hadoop学习笔记-Hadoop初识

hadoop学习笔记（三）

hadoop学习笔记（一）

hadoop学习笔记（二）

Hadoop学习笔记

hadoop学习笔记4

hadoop学习笔记3

hadoop学习笔记1

Hadoop 学习笔记（一）

hadoop 学习笔记 1

Hadoop 学习笔记（二）

Hadoop学习笔记一

hadoop 学习笔记

Hadoop学习笔记 (四)

Hadoop学习笔记 (三)

Hadoop学习笔记 (二)

Hadoop学习笔记 (一)

hadoop学习笔记-目录

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)