¿Qué es Elasticsearch?

¿Qué es Elasticsearch?

En pocas palabras, nuestro objetivo es ayudar a todos a encontrar lo que necesitan más rápido, desde los empleados que necesitan documentos en su intranet hasta los clientes que compran en línea para encontrar zapatos que les queden bien. Pero desde un punto de vista más técnico, se describe a grandes rasgos de la siguiente manera:

Elasticsearch es un motor de análisis y búsqueda distribuido, gratuito y abierto para todo tipo de datos, incluidos datos textuales, numéricos, geoespaciales, estructurados y no estructurados, y más. Elasticsearch se desarrolló sobre Apache Lucene y fue lanzado por primera vez en 2010 por Elasticsearch NV (ahora Elastic). Conocido por su sencilla API de estilo REST, su naturaleza distribuida, su velocidad y su escalabilidad, Elasticsearch es un componente central del Elastic Stack; un conjunto de herramientas gratuitas y de código abierto para la recopilación, expansión, almacenamiento, análisis y visualización de datos. La gente generalmente se refiere a Elastic Stack como ELK Stack (refiriéndose a Elasticsearch, Logstash y Kibana). Actualmente, Elastic Stack incluye una serie de agentes de recopilación de datos livianos y ricos, que colectivamente se denominan Beats, que se pueden usar para enviar datos a Elasticsearch.

¿Para qué se utiliza Elasticsearch?

Elasticsearch destaca por su velocidad y escalabilidad, y su capacidad para indexar muchos tipos de contenido significa que puede usarse para una variedad de casos de uso:

  • búsqueda de aplicaciones
  • búsqueda de sitio
  • búsqueda empresarial
  • Procesamiento y análisis de registros.
  • Métricas de infraestructura y monitoreo de contenedores.
  • Monitoreo del rendimiento de las aplicaciones
  • Análisis y visualización de datos geoespaciales
  • análisis de seguridad
  • análisis de negocios

¿Cómo funciona Elasticsearch?

Los datos sin procesar se introducen en Elasticsearch desde múltiples fuentes, incluidos registros, métricas del sistema y aplicaciones web. La ingestión de datos se refiere al proceso de analizar, normalizar y enriquecer estos datos sin procesar antes de indexarlos en Elasticsearch . Una vez que estos datos se indexan en Elasticsearch, los usuarios pueden ejecutar consultas complejas en sus datos y usar agregaciones para recuperar resúmenes complejos de sus datos. En Kibana, los usuarios pueden crear visualizaciones potentes basadas en sus propios datos, compartir paneles y administrar el Elastic Stack.

¿Qué son los índices de Elasticsearch?

Un  índice de Elasticsearch es una colección de documentos relacionados. Elasticsearch almacena datos como documentos JSON. Cada documento establece una relación entre un conjunto de claves (nombres de campos o propiedades) y sus valores correspondientes (cadenas, números, booleanos, fechas, grupos de números , ubicaciones geográficas u otro tipo de datos).

Elasticsearch utiliza una estructura de datos llamada índice invertido , que está diseñada para permitir búsquedas de texto completo muy rápidas. Un índice invertido enumera cada término único que aparece en todos los documentos y busca todos los documentos que contienen cada término.

Durante la indexación, Elasticsearch almacena documentos y crea un índice invertido para que los usuarios puedan buscar datos de documentos casi en tiempo real. El proceso de indexación se inicia en la API de indexación, a través de la cual puede agregar documentos JSON a un índice particular o cambiar documentos JSON en un índice particular.

¿Para qué se utiliza Logstash?

Logstash es uno de los productos principales de Elastic Stack, que se puede utilizar para agregar y procesar datos y enviarlos a Elasticsearch. Logstash es una canalización de procesamiento de datos del lado del servidor de código abierto que le permite ingerir datos de múltiples fuentes simultáneamente, enriquecerlos y transformarlos antes de indexarlos en Elasticsearch.

¿Para qué se utiliza Kibana?

Kibana es una herramienta de gestión y visualización de datos para Elasticsearch que proporciona histogramas, gráficos de líneas, gráficos circulares y mapas en tiempo real. Kibana también incluye aplicaciones avanzadas como Canvas y Elastic Maps; Canvas permite a los usuarios crear infografías dinámicas personalizadas basadas en sus propios datos, y Elastic Maps se puede utilizar para visualizar datos geoespaciales.

¿Por qué utilizar Elasticsearch?

Elasticsearch es rápido. Debido a que Elasticsearch se basa en Lucene, funciona muy bien en la búsqueda de texto completo. Elasticsearch también es una plataforma de búsqueda casi en tiempo real, lo que significa que el retraso entre la indexación de un documento y su capacidad de búsqueda es de tan solo un segundo. Como resultado, Elasticsearch es ideal para casos de uso en los que el tiempo es crítico, como análisis de seguridad y monitoreo de infraestructura.

Elasticsearch se distribuye en la naturaleza. Los documentos almacenados en Elasticsearch se distribuyen en diferentes contenedores llamados fragmentos , que se pueden replicar para proporcionar copias redundantes de los datos en caso de falla del hardware. La naturaleza distribuida de Elasticsearch le permite escalar a cientos (o incluso miles) de servidores y procesar petabytes de datos.

Elasticsearch incluye un amplio conjunto de funciones. Además de ventajas como velocidad, escalabilidad y elasticidad, Elasticsearch tiene una gran cantidad de potentes funciones integradas (como agregación de datos y gestión del ciclo de vida del índice), que pueden facilitar a los usuarios almacenar y buscar datos de manera más eficiente.

El Elastic Stack simplifica la ingesta, visualización y generación de informes de datos. La integración con Beats y Logstash permite a los usuarios procesar datos fácilmente antes de indexarlos en Elasticsearch. Al mismo tiempo, Kibana no solo puede proporcionar visualización en tiempo real de los datos de Elasticsearch, sino que también proporciona una interfaz de usuario para que los usuarios accedan rápidamente a datos como el monitoreo del rendimiento de las aplicaciones (APM), registros e indicadores de infraestructura.

Supongo que te gusta

Origin blog.csdn.net/luobowangjing/article/details/132173520
Recomendado
Clasificación