Configuration类

先简单说下业务:有一个单独的模块,可以在远程下载Hadoop上的索引,然后合并压缩,最后推送到solr服务器上

原来使用的是Ant打包,外部的jar是在执行主体的jar时cp进环境变量的,所以没有出现今天要说的这个问题,伪代码如下:

先把所有外部的jar的路径,拼接好一个字符串path,然后将path传入下面执行的代码

java -cp  path  com.xxx.xxx.Test

现在要统一项目风格,要把Ant项目转换为Maven项目,大体上没啥问题,由于不写MapReduce,仅仅使用HDFS api操作文件系统上的一些数据,所以引入的依赖如下,并没有hadoop-client



打包也很顺利,但是,当到Linux上,执行远程下载Hadoop上的
数据时,总是报如下的异常:



然后检查了下项目依赖的包,发现不缺依赖的jar,经过找资料,发现原来是maven-assembly 这个插件在打包时,覆盖了hadoop的两个关键属性:

Java代码 复制代码  收藏代码
  1. conf.set("fs.hdfs.impl", org.apache.hadoop.hdfs.DistributedFileSystem.class.getName());  
  2.  conf.set("fs.file.impl", org.apache.hadoop.fs.LocalFileSystem.class.getName());  
conf.set("fs.hdfs.impl", org.apache.hadoop.hdfs.DistributedFileSystem.class.getName());
 conf.set("fs.file.impl", org.apache.hadoop.fs.LocalFileSystem.class.getName());


如何解决?
方法一:
在实例化Configuration类 , 加入如下属性:



方法二:在项目路径下新建一个core-site.xml配置如下属性即可


 

猜你喜欢

转载自weitao1026.iteye.com/blog/2266980