hadoop 默认端口说明

Hadoop集群的各部分一般都会使用到多个端口,有些是daemon之间进行交互之用,有些是用于RPC访问以及HTTP访问。而随着Hadoop周边组件的增多,完全记不住哪个端口对应哪个应用,特收集记录如此,以便查询。

这里包含我们使用到的组件:HDFS, YARN, Hbase, Hive, ZooKeeper。
组件 Daemon 端口 配置 说明

HDFS DataNode   50010   dfs.datanode.address    datanode服务端口,用于数据传输
                    50075   dfs.datanode.http.address   http服务的端口
                    50475   dfs.datanode.https.address  https服务的端口
                    50020   dfs.datanode.ipc.address    ipc服务的端口
       NameNode     50070   dfs.namenode.http-address   http服务的端口
                    50470   dfs.namenode.https-address  https服务的端口
                    8020    fs.defaultFS    接收Client连接的RPC端口,用于获取文件系统metadata信息。
       journalnode  8485    dfs.journalnode.rpc-address     RPC服务
                    8480    dfs.journalnode.http-address    HTTP服务
       ZKFC         8019    dfs.ha.zkfc.port    ZooKeeper FailoverController,用于NN HA
YARN   ResourceManager    8032  yarn.resourcemanager.address    RM的applications manager(ASM)端口
                          8030  yarn.resourcemanager.scheduler.address  scheduler组件的IPC端口
                          8031  yarn.resourcemanager.resource-tracker.address   IPC
                          8033  yarn.resourcemanager.admin.address  IPC
                          8088  yarn.resourcemanager.webapp.address     http服务端口
       NodeManager        8040  yarn.nodemanager.localizer.address  localizer IPC
                          8042  yarn.nodemanager.webapp.address     http服务端口
                          8041  yarn.nodemanager.address    NM中container manager的端口
    JobHistory Server     10020     mapreduce.jobhistory.address    IPC
                          19888     mapreduce.jobhistory.webapp.address     http服务端口
HBase   Master            60000     hbase.master.port   IPC
                          60010     hbase.master.info.port  http服务端口
        RegionServer      60020     hbase.regionserver.port     IPC
                          60030     hbase.regionserver.info.port    http服务端口
        HQuorumPeer       2181  hbase.zookeeper.property.clientPort     HBase-managed ZK mode,使用独立的ZooKeeper集群则不会启用该端口。
                          2888  hbase.zookeeper.peerport    HBase-managed ZK mode,使用独立的ZooKeeper集群则不会启用该端口。
                          3888  hbase.zookeeper.leaderport  HBase-managed ZK mode,使用独立的ZooKeeper集群则不会启用该端口。
 Hive    Metastore        9083  /etc/default/hive-metastore中export PORT=<port>来更新默认端口    
         HiveServer       10000     /etc/hive/conf/hive-env.sh中export HIVE_SERVER2_THRIFT_PORT=<port>来更新默认端口     
ZooKeeper   Server        2181  /etc/zookeeper/conf/zoo.cfg中clientPort=<port>   对客户端提供服务的端口
                          2888  /etc/zookeeper/conf/zoo.cfg中server.x=[hostname]:nnnnn[:nnnnn],标蓝部分  follower用来连接到leader,只在leader上监听该端口。
                          3888  /etc/zookeeper/conf/zoo.cfg中server.x=[hostname]:nnnnn[:nnnnn],标蓝部分  用于leader选举的。只在electionAlg是1,23(默认)时需要。

所有端口协议均基于TCP。

对于存在Web UI(HTTP服务)的所有hadoop daemon,有如下url:

/logs
日志文件列表,用于下载和查看

/logLevel
允许你设定log4j的日志记录级别,类似于hadoop daemonlog

/stacks
所有线程的stack trace,对于debug很有帮助

/jmx
服务端的Metrics,以JSON格式输出。

/jmx?qry=Hadoop:*会返回所有hadoop相关指标。
/jmx?get=MXBeanName::AttributeName 查询指定bean指定属性的值,例如/jmx?get=Hadoop:service=NameNode,name=NameNodeInfo::ClusterId会返回ClusterId。
这个请求的处理类:org.apache.hadoop.jmx.JMXJsonServlet

而特定的Daemon又有特定的URL路径特定相应信息。

NameNode:http://:50070/

扫描二维码关注公众号,回复: 2153979 查看本文章

/dfshealth.jsp
HDFS信息页面,其中有链接可以查看文件系统

/dfsnodelist.jsp?whatNodes=(DEAD|LIVE)
显示DEAD或LIVE状态的datanode

/fsck
运行fsck命令,不推荐在集群繁忙时使用!

DataNode:http://:50075/

/blockScannerReport
每个datanode都会指定间隔验证块信息

原文地址:https://blog.csdn.net/lishaojun0115/article/details/71713780

猜你喜欢

转载自blog.csdn.net/u012834750/article/details/80849171