Big Data Series (8) Introducción a la ecología de Hadoop

EcosferaInserte la descripción de la imagen aquí

Introducción a HBase

  • Base de datos distribuida de lectura y escritura en tiempo real altamente confiable, de alto rendimiento, orientada a columnas, escalable
  • Use HDFS como su sistema de almacenamiento de archivos, soporte del programa MR para leer datos
  • Almacenar datos no estructurados y semiestructurados

RowKey : identificación de datos única, ordenada por diccionario
Familia de columnas: familia de columnas, una colección de varias columnas, no más de 3
** Marcas de tiempo de marca de tiempo: ** se admiten varias versiones de datos al mismo tiempo
Inserte la descripción de la imagen aquí

Chispa - chispear

  • Marco de cómputo paralelo de Big Data basado en memoria
  • Spark es una alternativa a MapReduce, compatible con HDFS, HIVE y otras fuentes de datos
  • Estructura de datos de almacenamiento de memoria distribuida abstracta, conjunto de datos distribuidos elásticos RDD
  • Basado en la unidad de eventos, mejore el rendimiento reutilizando hilos en el grupo de hilos
Publicado 35 artículos originales · ganó 3 · vistas 3300

Supongo que te gusta

Origin blog.csdn.net/qq_43430261/article/details/105545115
Recomendado
Clasificación