La práctica del flujo de aire en Meituan Dianping

Autor: Zen y el arte de la programación informática

1. Introducción

1.1 Introducción a los antecedentes del proyecto

El Centro de datos de Meituan-Dianping es un equipo independiente del Departamento de Tecnología de Meituan, que es responsable del desarrollo de datos, la construcción de plataformas de datos, la construcción de almacenes de datos, el soporte de aplicaciones de datos, etc. Como empresa de servicios de plataforma de datos a nivel de operador, al crear una plataforma de herramientas de análisis de big data para analistas y científicos de datos, un sistema de producto completo y un mecanismo de gobernanza de datos, combinado con el impulso de valor de los datos, mejora la eficiencia de la toma de decisiones comerciales. y ayuda a Meituan y a las instituciones relevantes a lograr mayores rendimientos.

Con la continua expansión del negocio de la empresa, el crecimiento de los usuarios y la aparición de nuevos escenarios de Internet, se requiere una gran cantidad de procesamiento, análisis y almacenamiento de datos, al tiempo que se garantiza la precisión, integridad y confiabilidad de los datos. Por lo tanto, este artículo realizará un análisis exhaustivo y una introducción a Airflow, el sistema de almacenamiento de datos del centro de datos de Meituan-Dianping.

1.2 Conceptos y características del almacén de datos

1.2.1 Descripción general del almacén de datos

El almacén de datos generalmente se refiere a una colección de datos utilizados en una empresa para integrar y resumir datos de múltiples sistemas fuente. Es un repositorio altamente organizado diseñado para soportar una amplia gama de tareas complejas de consultas, informes y análisis. Sus funciones incluyen principalmente los siguientes aspectos:

  1. Dividir datos por tema: Los datos se dividen en diferentes tablas según temas, cada tabla contiene datos relacionados con un tema determinado, que se pueden administrar y utilizar fácilmente;
  2. Proporciona un conjunto de datos central: todos los datos de origen se limpian, organizan y almacenan en el almacén de datos para formar un conjunto de datos central;
  3. Modelo de datos unificado: el almacén de datos tiene un esquema de base de datos unificado, lo que permite a los analistas acceder a datos de diferentes fuentes de la misma manera;
  4. Facilite la generación de informes y análisis: los datos del almacén de datos se pueden utilizar para crear varios informes y paneles, lo que hace que sea simple y fácil obtener, presentar y analizar todo tipo de información;
  5. Admite análisis de datos históricos: almacén de datos

Supongo que te gusta

Origin blog.csdn.net/universsky2015/article/details/133004510
Recomendado
Clasificación