Big Data se ha calentado gradualmente en los últimos años, y la gente a menudo pregunta por qué es importante. Estamos en una era de explosión de datos,
Una gran cantidad de teléfonos inteligentes, tabletas, dispositivos portátiles y dispositivos IoT emergentes están generando nuevos datos en todo momento.
Una solución de Big Data generalmente contiene múltiples componentes importantes, desde capas de hardware como almacenamiento, informática y redes, hasta procesamiento de datos
El motor, y luego la capa de análisis que utiliza algoritmos estadísticos y de cálculo mejorados y visualización de datos para obtener información comercial. En el medio
El motor de procesamiento de datos juega un papel muy importante. No es exagerado decir que los motores de procesamiento de datos tratan los grandes datos como una CPU
A la computadora, o el cerebro a los humanos.
Obtener información
Resumen ejecutivo
Este libro fue creado conjuntamente por los desarrolladores de Spark y los miembros principales, y explica la eficiencia y rapidez
Una herramienta para analizar y procesar rápidamente datos: Spark, que lleva al lector a dominar rápidamente la recopilación, el cálculo, la simplificación y la preservación de
El método de medición de datos, aprender a interactuar, iterar y análisis incremental, resolver los problemas de particionamiento, localización de datos y serialización personalizada.
Este libro es adecuado para todos los que necesitan análisis de datos en la era de los grandes datos.
Características de este libro.
La estructura de este libro es clara, y los capítulos están organizados en el orden de lectura de adelante hacia atrás. Al comienzo de cada capítulo, diremos
Está claro qué subsecciones en este capítulo son más importantes para los científicos de datos, y qué subsecciones son más útiles para los ingenieros. Palabras
Sin embargo, esperamos que todo el contenido del libro sea útil para ambos tipos de lectores.
Los primeros dos capítulos lo llevarán a comenzar, le permitirán construir un Spark básico en su computadora y le permitirán usar Spark
Hay un concepto básico de lo que se puede hacer. Después de comprender el objetivo de Spark y la instalación de Spark, comenzaremos
Reintroduzca la carcasa Spark. El shell Spark es una herramienta muy útil cuando se desarrollan prototipos de aplicaciones Spark. Se detallarán los siguientes capítulos.
Presente la API de Spark, cómo ejecutar aplicaciones de Spark en el clúster y la biblioteca de nivel superior proporcionada por Spark
Soporte, como SQL (soporte de base de datos) y MLlib (biblioteca de aprendizaje automático).
Captura de pantalla del directorio
Programación avanzada de Spark
Ejecute Spark en el clúster
Spark Streaming
Aprendizaje automático basado en MLlib