Diferencia entre la arquitectura y la versión de Hadoop
Prólogo
En primer lugar, tenemos que aclarar los dos problemas centrales resueltos por el marco de Hadoop: almacenamiento y cálculo de datos masivos . En el almacenamiento, Hadoop implementa su propio sistema de archivos distribuido HDFS (Hadoop Distributed File System); en informática, Hadoop utiliza un marco informático distribuido fuera de línea MapReduce .
1. Arquitectura de Hadoop 1.x
Hadoop 1.x se compone de Common (herramientas auxiliares), HDFS (almacenamiento de datos), MapReduce (informática + programación de recursos).
2. Arquitectura de Hadoop 2.x
Hadoop 2.x se compone de Common (herramientas auxiliares), HDFS (almacenamiento de datos), MapReduce (informática) y Yarn (programación de recursos) .
3. diferencia
Como se puede ver en lo anterior, la principal diferencia entre 2.xy 1.x es que 2.x refina la programación de recursos y se asigna a Yarn, mientras que MapReduce solo es responsable del cálculo. 1.x 2.x más tal acoplamiento menos.