PDI(Kettle)5.3在windows下运行mapreduce - 代码天地

PDI(Kettle)5.3在windows下运行mapreduce

企业开发 2018-05-12 03:36:43 阅读次数: 0

原创文章，转载请注明出处：http://qq85609655.iteye.com/blog/2109124

最近，hadoop升级到了最新的2.6版本

使用ambari 部署完毕后。

以前都是在linux下，通过VNC开发，非常不方便，尤其复制黏贴，时灵时不灵。

而且，响应也没有本机(公司的台式机windows)上那么快，工作效率下降。

于是，开始了windows和linux上mapreduce的研究

首先，需要在windows下访问hdfs，我本机的用户是abc，测试服务器用的是简单权限，没有用kerberos，所以在hdfs-site.xml添加如下配置:

    <property>
      <name>hadoop.proxyuser.abc.groups</name>
      <value>*</value>
    </property>
    
    <property>
      <name>hadoop.proxyuser.abc.hosts</name>
      <value>*</value>
    </property>

到了这一步，我们可以访问hdfs了

接下来，执行Mapreduce，报错，windows上报如下:

再查看nodemanager上的节点日志

Error: Could not find or load main class org.apache.hadoop.mapreduce.v2.app.MRAppMaster

既然无法加载，或者找不到类，那么就是classpath的问题。

找到执行mr的临时文件夹

/hadoop/yarn/local/usercache/abc/appcache

在这里找到当前的正要执行的job

查看 launch_container.sh 发现:

linux和windows的分隔符(linux为冒号，windows为分号)不一样导致了windows的job在linux无法执行

既然找到了问题，解决就很简单了。

mapred-site.xml

    <property>
      <name>mapreduce.app-submission.cross-platform</name>
      <value>true</value>
    </property>

再尝试下，OK，完美！

猜你喜欢

转载自qq85609655.iteye.com/blog/2193911

PDI(Kettle)5.3在windows下运行mapreduce

Windows下用myeclipse运行MapReduce程序

利用PDI(Kettle)构造数据

PDI(Kettle)5.1配置hadoop

开源的etl工具kettle(PDI)

windows下安装Kettle

在Windows下安装Kettle

在Kettle(PDI)跑Apache Spark作业

编译Kettle的PDI DB Dialog模块失败

pdi 8.2（kettle）在linux运行时图形界面中资源库中各菜单为灰色

MapReduce 程序在 Windows 本地模式下运行报错问题的解决

windows下运行mapreduce报错The auxService mapreduce_shuffle do 解决方案

Windows下的kettle的安装与配置

Pentaho Data Integration (PDI/Kettle)与Java版本支持关系

PDI KETTLE6.0打包注意事项

linux 下安装并运行kettle 程序

IDEA下编译运行kettle8.3

kettle5.3实现元数据注入的转换以集群模式运行

Windows下开发hadoop的MapReduce

Windows下的MapReduce编程实现

windows下Kettle 处理中文乱码

windows本地运行hadoop的MapReduce程序

Hadoop之MapReduce 本机windows模式运行

在windows本地的Idea上运行mapreduce

Windows下安装Apache2.2+PHP5.3+MySQL5.5.15

windows下编译lua5.3源代码

windows下运行Eigen

windows下运行nginx

windows下运行bochs

windows下运行mapreduce报错Could not locate executable null bin winutils.exe in the Hadoop binaries 解决方案

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)