Hadoop and yarn configuration

Yarn is integrated in hadoopV2
to manage the scheduling of computing resources and tasks

There are several configurations in the hadoop-2.6.0/etc/hadoop/ directory:

storage resources

core-site.xml:

里面可以配置fs.defaultFS,也就是一些路径映射
有一个总的   viewfs   ,   
    不同的路径可以映射到不同的hdfs集群的具体路径
    注意,viewfs里面的一个路径唯一地映射到一个hdfs集群的具体路径

hdfs-site.xml:

这里面可以配置 多个具体的hdfs集群: dfs.nameservices
每个hdfs集群又有一堆配置,比如namenode,datanode等等
以及zookeeper,用来做ha高可用

computing resources

mapred-site.xml:

里面指定使用yarn的方式来管理计算,主要是mr任务
以及一些mr任务相关的默认配置

yarn-site.xml:

具体的yarn配置
yarn是运行在hdfs上的
mr运行在yarn,spark,storm都可以运行在yarn上

Guess you like

Origin http://43.154.161.224:23101/article/api/json?id=325861624&siteId=291194637