Ecosfera
Introducción a HBase
- Base de datos distribuida de lectura y escritura en tiempo real altamente confiable, de alto rendimiento, orientada a columnas, escalable
- Use HDFS como su sistema de almacenamiento de archivos, soporte del programa MR para leer datos
- Almacenar datos no estructurados y semiestructurados
RowKey : identificación de datos única, ordenada por diccionario
Familia de columnas: familia de columnas, una colección de varias columnas, no más de 3
** Marcas de tiempo de marca de tiempo: ** se admiten varias versiones de datos al mismo tiempo
Chispa - chispear
- Marco de cómputo paralelo de Big Data basado en memoria
- Spark es una alternativa a MapReduce, compatible con HDFS, HIVE y otras fuentes de datos
- Estructura de datos de almacenamiento de memoria distribuida abstracta, conjunto de datos distribuidos elásticos RDD
- Basado en la unidad de eventos, mejore el rendimiento reutilizando hilos en el grupo de hilos