hadoop各模块含义及对应的配置

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xianchanggui8674/article/details/78613829

HDFS模块

  • NameNode

NameNode是主节点,存储文件的元数据,如文件名,文件目录结构,文件属性,以及每个文件的块列表和块所在的DataNode等。NameNode的元数据中的一部分存放在内存中的,在进程当中,另一部分存放在本地磁盘(fsimage:镜像文件和edits:编辑日志)

core-site.xml中配置

<property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:8020</value>
</property>
  • DataNodes

在本地文件系统存储文件块数据,以及块的校检

slaves文件中配置

  • Secondary NameNode

用来监控HDFS状态的后台程序,每隔一段时间获取一次快照

hdfs-site.xml中配置

<property>
    <name>dfs.namenode.secondary.http-address</name>
    <value>localhost:50090</value>
</property>

YARN模块

  • ResourceManager

处理客户端请求;启动/监控ApplicationMaster;监控NodeManager;资源分配与调度

yarn-site.xml配置

<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>localhost</value>
</property>
  • NodeManagers

单个节点上的资源管理;处理来自ResourceManager的命令;处理来自ApplicationMaster的命令

slaves文件中的配置

  • ApplicationMaster

数据切分;为应用程序申请资源,并分配给内部任务;任务监控与容错

  • Container

对任务运行环境的抽象,封装了CPU、内存等多维资源以及环境变量、启动命令等任务运行相关的信息

MapReduce

  • 历史日志HistoryServer

可以查看mapreduce程序执行的历史日志

<property>
        <name>mapreduce.jobhistory.address</name>
        <value>localhost:10020</value>
    </property>

    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>localhost:19888</value>
    </property>

猜你喜欢

转载自blog.csdn.net/xianchanggui8674/article/details/78613829