MapReduce运行方式 - 代码天地

MapReduce运行方式

编程语言 2018-08-05 19:57:11 阅读次数: 0

1.本地运行

（1）exclipse、idea运用的这两个工具中需要添加两个依赖

启动最小的集群，进行测试

<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-minicluster</artifactId>
    <version>2.7.6</version>
</dependency>

定义运行的客户端
<dependency>
    <groupId>org.apache.hadoop</groupId>
    <artifactId>hadoop-client</artifactId>//运行的客户端
    <version>2.7.6</version>
</dependency>

（2）因此就可以开发mapreduce,处理windows上的文件

操作的文件路径为Windows 中的D:/a/1下的文件

eclipse 中进行传参

从日志中也可以看出是本地执行：

2.本地运行+HDFS文件

（1）添加配置文件+java代码中添加：（两种方式）

法1：

法2：

（2）可以操作hdfs的文件，即输入输出文件可以是HDFS 上的文件。

输入文件：

输出的结果：（在HDFS 上可以查看）

（3）原因：因为它的默认的配置：

1）yarn.nodemanager.hostname=0.0.0.1

默认${yarn.nodemanager.hostname}:0，即随机使用临时端口，官方解释是"The address of the container manager in the NM"。NodeManager不能对RPC server使用临时端口，因为NM在重启后会更换端口，会打断重启前的container与NodeManager的连接，设置后可以固定使用同一个的端口

2） mapreduce.framework.name=local 本地。

新框架支持第三方 MapReduce 开发框架以支持如 SmartTalk/DGSG 等非 Yarn 架构，注意通常情况下这个配置的值都设置为 Yarn，如果没有配置这项，那么提交的 Yarn job 只会运行在 locale 模式，而不是分布式模式。

3.本地开发提交运行

步一：将配置文件放到

步二：

（1）在mapred-site.xml中添加（因为是跨平台提交）

（2）在yarn-site.xml (resourcemanager的hostname)

步三：打Jar包

（1）打Jar包的时候，一定要把job.setJarByClass()的参数换成getClass();

设置job中的资源所在的jar包，该方法的作用是通过传入的class 找到job的jar包，我们设置的class 跟我们的job类位于同一个包中，通过public void setJarByClass(Class cls) 返回的是就是我们job包的jar。

（2）运行时

以上三种方式，即为MapReduce运行方式运行的三种方式，如果您有不同的见解可以随时联系我。

猜你喜欢

转载自blog.csdn.net/qq_37042789/article/details/81410309

MapReduce运行方式

MapReduce 程序运行方式

MapReduce3种运行方式

运行mapreduce

以本地方式运行mapreduce程序的参数配置

MapReduce程序运行部署的几种方式 - 结尾附源码

MapReduce程序运行流程

hadoop (mapreduce运行原理)

MapReduce的运行流程

运行mapreduce，报ClassNotFoundException

运行MapReduce的时候OOM

mapreduce运行机制

mapreduce运行原理及YARN

Eclipse本地运行MapReduce

MapReduce运行流程分析

mapreduce运行平台YARN

Hadoop Mapreduce运行流程

MapReduce运行原理

Mapreduce的Job运行流程

关于mapreduce运行错误

MapReduce运行流程

MapReduce作业运行流程

MapReduce程序运行拆解

运行MapReduce作业

运行MapReduce使出错

MapReduce on Yarn运行原理

mapreduce运行的bug收录

eclipse运行mapreduce的wordcount

MapReduce程序运行模式

MapReduce的Uber运行模式

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)