Hadoop 之分布式缓存的原理和方法——DistributedCache

其他 2018-09-28 17:43:11 阅读次数: 0

1.什么时Hadoop的分布式缓存

答：在执行MapReduce时，可能Mapper之间需要共享一些信息，如果信息量不大，可以将其从HDFS中加载到内存中，这就是Hadoop分布式缓存机制。

2.如何使用缓存机制

答：在main方法中加载共享文件的HDFS路径，路径可以是目录也可以是文件。可以在路径末尾阶段追加 '#' +别名，在map阶段可以使用该别名。

这时执行第一步的代码：

String cache = "hdfs://10.105.xx.xxxx:8020/cache/file";  //目录或者文件
cache += "#myfile";  //file是文件的别名
job.addCacheFile(new Path(cache).toUri(), conf);  //添加到job设置

第二步，在Mapper类或者Reducec的setup方法中，用输入流获取分布式缓存文件。

protected void setup(Context context) throws IOException,InterruptedEXception {
          FileReader reader = new FileReader("myfile");
          BuffereReader br = new BufferedReader(reader);
}

猜你喜欢

转载自blog.csdn.net/weixin_38625805/article/details/82194400

Hadoop 之分布式缓存的原理和方法——DistributedCache

Hadoop分布式缓存(DistributedCache)

Hadoop入门(10)--分布式缓存DistributedCache

DistributedCache是Hadoop的一个分布式文件缓存类

hadoop之伪分布式模式

Hadoop之伪分布式

Hadoop之伪分布式安装

hadoop学习之hadoop完全分布式集群安装

Hadoop运行模式之完全分布式部署Hadoop

Hadoop系列之Hadoop分布式系统介绍

hadoop分布式缓存

【大数据之Hadoop】从自定义 RPC 到 Hadoop RPC ，理解分布式通信系统的底层工作原理

Hadoop之--HDFS原理

Hadoop 之 MapReduce原理

Hadoop 之 HDFS原理

大数据学习之hadoop(完全分布式)

hadoop伪分布式安装之Linux环境准备

大数据系列之Hadoop分布式集群部署

hadoop学习之 hbase 完全分布式安装

hadoop之Yarn的伪分布式部署

Hbase分布式搭建之hadoop搭建

Hadoop之搭建完全分布式运行模式

Hadoop安装之伪分布式搭建

Hadoop2.2.0伪分布式之MapReduce简介

hadoop之spark完全分布式环境搭建

hadoop集群搭建之伪分布式

Hadoop运行模式之伪分布式运行模式

Hadoop完全分布式集群之CentOS配置

Hadoop分布式文件系统之HDFS

Hadoop学习之安装伪分布式

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

Hadoop 之 分布式缓存的原理和方法——DistributedCache

猜你喜欢

Hadoop 之分布式缓存的原理和方法——DistributedCache