通过jps可以查看相应的进程列表,主要进程如下:
org.apache.hadoop.hdfs.server.namenode.NameNode; org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode; org.apache.hadoop.hdfs.server.datanode.DataNode; org.apache.hadoop.mapred.JobTracker; org.apache.hadoop.mapred.TaskTracker;
NameNode:
Hadoop中神经中枢,Hadoop是单节点的(虽然有SecondaryNameNode),NameNode里存储的是元数据,那些数据文件在那些DataNode里存储。DataNode发生变化的时候会向他汇报自己的数据状态信息
SecondaryNameNode:
只跟NameNode进行通信,随时待命(需要手动才能将他变为NameNode),也就是NameNode的一个备份。
DataNode:
具体的数据节点。
JobTracker:
Job的调度,任务的分配。
TaskTracker:
执行具体的Job,与JobTracker进行通信,当JobTracker感觉不到他的存在的时候就会重启一个任务到其他的节点中去,