En agosto, se publicó el "Informe de análisis de la industria de bases de datos de China", que se centra en los almacenes de datos y la primera publicación [Mapa global de la industria de almacenes de datos]

Para ayudar a todos a comprender el estado de desarrollo de la industria de bases de datos de China de manera oportuna y ordenar el entorno actual del mercado de bases de datos y la ecología de los productos, a partir de abril de 2022, el equipo de investigación y análisis de la industria de la Comunidad Motianlun continuará lanzando lo último " Industria de bases de datos de China "para todos todos los meses . Informe de análisis" , que continúa difundiendo el conocimiento de la tecnología de datos y esforzándose por promover la innovación tecnológica y el desarrollo ecológico de la industria . Se actualizó al número dieciséis y se publicó un informe de análisis anual de 2022 con un total de 122 páginas .

Se ha publicado oficialmente el "Informe de análisis de la industria de bases de datos de China" de agosto de Motianlun (haga clic para saltar, todos pueden descargarlo y revisarlo). Este informe hace un balance del "Ranking de popularidad de bases de datos de China" de Motianlun, los lanzamientos de nuevos productos, las inversiones y la financiación , etc. Información de la industria, con el fin de mostrar los desarrollos de vanguardia actuales en el mercado de bases de datos.

Este informe se centra en el almacén de datos, presenta en detalle su evolución arquitectónica y sus principios técnicos, y resume las cinco características técnicas principales y las seis tendencias de desarrollo principales. Es la primera versión del [Mapa global de la industria del almacenamiento de datos] y, finalmente, selecciona el almacén de datos típico . casos de productos en el país y en el extranjero. Se espera que sus principios y características lo lleven a una comprensión más completa y profunda de los puntos de conocimiento y las prácticas de aplicación de la tecnología de almacenamiento de datos.

1. Clasificaciones de bases de datos y tendencias de vanguardia

 Contenido de este capítulo

  • Análisis de los rankings de popularidad de las bases de datos chinas en agosto

Un total de 286 bases de datos participaron en el ranking de popularidad de la base de datos de Motianlun China en agosto de 2023. Entre las diez primeras del ranking de este mes, los principales cambios se han intensificado. Entre ellos, OceanBase  ganó el primer lugar durante nueve meses consecutivos, la clasificación de TiDB  subió un lugar al segundo lugar con respecto al mes anterior, y la clasificación de Alibaba Cloud  PolarDB  continuó subiendo durante dos meses consecutivos y alcanzó el cuarto lugar este mes.

La clasificación de varios productos potenciales en la clasificación de este mes ha aumentado en comparación con el mes pasado. En las etapas 10 a 50, muchas bases de datos se lanzaron imparablemente a la competencia. Por ejemplo, la clasificación de Apache Doris , la base de datos OLAP de código abierto y desarrollo propio de Baidu,   subió un lugar respecto al mes anterior hasta el puesto 16; Alibaba Cloud  Hologres  fue una base de datos recién agregada para participar en la clasificación en agosto, y su clasificación estuvo cerca. del top 20 al 22; Star KunDB  subió 3 lugares hasta el puesto 28 este mes; gStore, un sistema de base de datos de gráficos nativo de código abierto para gráficos de conocimiento RDF desarrollado por el Laboratorio de Gestión de Datos del Instituto Wangxuan de La Universidad de Pekín, subió al puesto 31 este  mes  . BigInsights, un nuevo producto AiSQL de base de datos inteligente desarrollado en C++ diseñado y desarrollado de forma independiente por Bigmath  ,  ha subido rápidamente 63 lugares este mes en comparación con el mes anterior, y ahora ocupa el puesto 33.

  • Tendencias de desarrollo de la industria de bases de datos

El informe recopila información sobre inversiones y financiación, lanzamientos de nuevos productos, etc. que han atraído la atención reciente en la industria. Entre ellos, en agosto de 2023, el Ministerio de Finanzas, junto con el Ministerio de Industria y Tecnología de la Información, estudiaron y redactaron normas para los requisitos de contratación pública para bases de datos, sistemas operativos, servidores generales, software antivirus, middleware, computadoras portátiles y de escritorio. Computadoras, computadoras todo en uno, estaciones de trabajo , etc. Los estándares de requisitos de adquisiciones gubernamentales de bases de datos incluyen bases de datos distribuidas y bases de datos centralizadas. Además, se lanzó  Transwarp Scope 2.5 , una plataforma interactiva de análisis estadístico de recuperación de datos a nivel empresarial desarrollada independientemente por Xinghuan Technology,  y el informe explica sus características y funciones; la startup de base de datos Neon  recibió 46 millones de dólares en financiación; Oracle anunció el lanzamiento completo de  MySQL HeatWave Lakehouse Permite a los clientes consultar datos en el almacenamiento de objetos tan rápido como consultar datos dentro de una base de datos. Debido a limitaciones de espacio, aquí solo se toman algunas fotografías. Consulte el informe para obtener más detalles .

2. Descripción general y evolución tecnológica del almacén de datos.

 Contenido de este capítulo

  • Descripción básica del almacén de datos

En la era sin almacenes de datos, los analistas de datos necesitaban recopilar, limpiar e integrar datos de múltiples fuentes de datos y hacer copias parciales de los datos para cada entorno de soporte de decisiones. El proceso consumía mucho tiempo y tenía poca precisión. Y debido a que el sistema itera y se actualiza rápidamente, la fuente de datos suele ser un sistema empresarial antiguo que ha estado fuera de línea, lo que dificulta el análisis de datos. En este contexto de desarrollo  surgió el almacén de datos (Data Warehouse) .

El capítulo 2 del informe presenta específicamente el origen, la arquitectura jerárquica, las características básicas del almacén de datos, así como la evolución y el proceso de desarrollo de la arquitectura . Un almacén de datos es un depósito central de datos integrados de una o más fuentes dispares. Almacena datos actuales e históricos en una ubicación y se utiliza para crear informes analíticos para los empleados de toda la empresa. Está orientado a temas, es integrado y no volátil. , propiedades variables en el tiempo, etc.

Desde que Inmon propuso el concepto de almacén de datos en 1990, la arquitectura del almacén de datos también ha experimentado muchas evoluciones: ha evolucionado desde la arquitectura de almacén de datos tradicional original - almacén de datos fuera de línea - arquitectura de big data fuera de línea, arquitectura Lambda, arquitectura Kappa y Flink. La arquitectura integrada de flujo por lotes generada por el calor ha facilitado continuamente a los usuarios completar cálculos en tiempo real al costo más natural y mínimo.

Además, el informe también resume la historia del desarrollo de los almacenes de datos desde la incipiente exploración hasta la era de la integración empresarial, la era de la integración de datos empresariales, la era del caos: el debate entre el "padre de los almacenes de datos", el La era de la confirmación del modelo teórico y la era de la discordia de cien escuelas de pensamiento sobre productos de almacenamiento de datos, con la esperanza de ayudar a los lectores a comprender su contexto de desarrollo verticalmente, y el contenido específico se puede encontrar en el informe.

  • Análisis de la tecnología de almacenamiento de datos

El informe muestra los componentes centrales del almacén de datos a través de un diagrama de arquitectura : base de datos central, herramientas ETL (extracción, transformación, carga), metadatos y herramientas de acceso, y analiza en detalle las cinco tecnologías clave del almacén de datos : optimizador de consultas, MPP. arquitectura, vectorización, almacenamiento en columnas y compresión de datos.

El objetivo principal del optimizador de consultas es seleccionar el plan de ejecución óptimo para minimizar el costo de ejecución de la consulta, mejorando así el rendimiento de la consulta; mientras que la arquitectura MPP puede acelerar las operaciones de preprocesamiento de datos de múltiples fuentes para organizar los datos en un adecuado La forma de análisis; la vectorización puede mejorar la eficiencia del análisis de datos, por lo que se usa ampliamente en carga de datos, conversión, análisis de datos, consultas complejas y otras operaciones; el almacenamiento en columnas tiene una tasa de compresión más alta y una eficiencia de lectura y escritura más rápida que las filas almacenamiento y puede procesar datos de mayor calidad; en los almacenes de datos, la compresión generalmente se realiza utilizando una combinación de filas y columnas para mejorar la eficiencia del almacenamiento. Aquí solo enumeramos brevemente y capturamos de pantalla algunas de las características. Para obtener información más detallada, consulte el informe .

La ola de transformación digital ha arrastrado varios conceptos. Para ayudarle a aclarar las distinciones, este capítulo también presenta los conceptos de lago de datos, lago y almacén integrados, almacén de lago inteligente y otros términos relacionados que a menudo se confunden con el almacén de datos. Si está interesado, sus amigos pueden descargar el informe para revisarlo.

3. Estado actual y tendencias futuras de los almacenes de datos.

 Contenido de este capítulo

El capítulo 3 del informe analiza la situación actual y las tendencias de desarrollo del almacén de datos desde una perspectiva de desarrollo . En la actualidad, el mercado de almacenamiento de datos de China todavía tiene problemas como el corto historial de desarrollo del fabricante, el pequeño tamaño del mercado y el proceso de migración a la nube está relativamente rezagado con respecto al de Estados Unidos. Sin embargo, los escenarios digitales de las empresas chinas son más abundantes y la necesidad de digitalización es más urgente. En general, el mercado de almacenamiento de datos de China tiene un enorme potencial de desarrollo y experimentará un rápido crecimiento en el futuro. IDC predice que para 2027, el mercado de software de almacenamiento de datos de China alcanzará los 2.730 millones de dólares, con una tasa de crecimiento anual compuesta (CAGR) del mercado a cinco años del 25,7% entre 2022 y 2027.

Ante la aparición interminable de nuevas tecnologías, los almacenes de datos se desarrollarán en el futuro hacia el análisis en tiempo real, la integración sin servidores nativos de la nube, el almacén en lago, HTAP, la integración de inteligencia digital y los almacenes de datos en streaming . Interpretación de estos seis tipos de tendencias de desarrollo. Debido a limitaciones de espacio, aquí no se muestran capturas de pantalla detalladas, puede descargar el informe como referencia.

Finalmente, el informe compiló y publicó el [ Mapa global de la industria de almacenamiento de datos ], que diferencia los productos de almacenamiento de datos globales en dos dimensiones: código abierto y comercial, y chino y extranjero. Esperamos ayudar a todos a obtener una comprensión profunda del desarrollo. de la industria del almacenamiento de datos. Puede descargar el informe para ver la versión de alta definición .

4. Análisis de casos típicos de productos de bases de datos.

El último capítulo del informe selecciona como casos productos típicos de almacenamiento de datos en el país y en el extranjero, y presenta su arquitectura central, características funcionales y prácticas de aplicación .

Entre ellos, los productos extranjeros incluyen el almacén de datos elástico  Snowflake , que tiene soporte completo de SQL y soporte de modo de datos semiestructurados y sin esquema. Es un sistema elástico multiinquilino, transaccional, seguro y altamente escalable; el fundador de mercado de almacenamiento de datos  Teradata , que es principalmente adecuado para crear aplicaciones de almacenamiento de datos a gran escala, anunció oficialmente en 2023 que pondrá fin gradualmente a las operaciones directas en China; el almacén de datos empresarial totalmente administrado de Google, BigQuery, puede ayudar a los usuarios a través del aprendizaje automático, el análisis geoespacial  y  business Administre y analice datos con capacidades integradas, como inteligencia, y utilice almacenes de datos en la nube para impulsar la innovación basada en datos.

Los productos nacionales incluyenApache Doris , un moderno almacén de datos para análisis en tiempo real  . Es una base de datos analítica en tiempo real de alto rendimiento basada en la arquitectura MPP. No solo puede admitir escenarios de consulta puntual de alta concurrencia, sino también admitir escenarios de consulta puntuales de alta concurrencia. escenarios de análisis complejos de rendimiento; distribución de almacén de datos lógicos GBase 8 , su mercado principal es el mercado de análisis de negocios e inteligencia de negocios, y se puede aplicar a industrias con datos comerciales masivos como gobierno, comités de partidos, departamentos sensibles a la seguridad, defensa nacional, estadísticas. , etc.; el servicio de almacenamiento de datos distribuidos en la nube de nivel empresarial  GaussDB (DWS) de Huawei  Cloud es una base de datos de procesamiento de datos en línea basada en una infraestructura y plataforma en la nube, que proporciona servicios listos para usar, escalables y totalmente administrados; finalmente, presentó ArgoDB. desarrollado por Xinghuan para ayudar a las empresas a construir un  almacén de datos integral en tiempo real y el motor de almacén de datos integral en tiempo real Hologres  desarrollado por Alibaba Cloud  . Aquí solo se muestra una parte del contenido de este capítulo y puede descargar el informe para obtener más contenido.

Este artículo solo extrae y organiza parte del contenido del "Informe de análisis de la industria de bases de datos de China" de agosto. Para obtener contenido más completo y detallado, puede descargar el texto completo del informe. También invitamos a colegas de la industria de datos a comunicarse y discutir Y hagamos sugerencias. ¡Seamos testigos juntos de ello ...

Enlace de descarga del informe completo: https://www.modb.pro/doc/116039

Descargar informes anteriores

Se puede encontrar contenido más interesante en Motianlun Data Community , que brinda servicios integrales integrales en torno al aprendizaje y el crecimiento de las personas que utilizan datos, y continúa promoviendo la difusión del conocimiento y la innovación tecnológica en el campo de los datos. Agregue el asistente comunitario motianlun (VX: modb666) para obtener productos secos más técnicos.

Supongo que te gusta

Origin blog.csdn.net/Era666/article/details/132625399
Recomendado
Clasificación