Hadoop中几个重要的进程

通过jps可以查看相应的进程列表,主要进程如下:

org.apache.hadoop.hdfs.server.namenode.NameNode;
org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode;
org.apache.hadoop.hdfs.server.datanode.DataNode;
org.apache.hadoop.mapred.JobTracker;
org.apache.hadoop.mapred.TaskTracker;

NameNode:

Hadoop中神经中枢,Hadoop是单节点的(虽然有SecondaryNameNode),NameNode里存储的是元数据,那些数据文件在那些DataNode里存储。DataNode发生变化的时候会向他汇报自己的数据状态信息

SecondaryNameNode:

只跟NameNode进行通信,随时待命(需要手动才能将他变为NameNode),也就是NameNode的一个备份。

DataNode:

具体的数据节点。

JobTracker:

Job的调度,任务的分配。

TaskTracker:

执行具体的Job,与JobTracker进行通信,当JobTracker感觉不到他的存在的时候就会重启一个任务到其他的节点中去,

猜你喜欢

转载自snv.iteye.com/blog/1836877