El problema de liberar el valor de los datos se puede resolver con la plataforma básica de ciencia de datos

A fines del año pasado, se publicaron las "Opiniones del Comité Central del Partido Comunista de China y el Consejo de Estado sobre la creación de un sistema básico de datos para desempeñar mejor el papel de los elementos de datos" (en lo sucesivo, "Datos Veinte"). promulgado oficialmente, lo que marca que la construcción de un sistema básico de datos ha entrado en el carril rápido.Se espera que los elementos de datos se aceleren en todos los ámbitos.

Si bien los "Veinte Puntos de Datos" han atraído discusiones acaloradas, una vez más han convertido a la ciencia de datos en el centro de atención de todos los ámbitos de la vida. En general, la industria cree que mi país tiene una escala de datos masiva y escenarios de aplicaciones ricos, que activan completamente el potencial de los elementos de datos y fortalecen la economía digital sin el apoyo a largo plazo de la ciencia de datos.

Coincidentemente, en la Cumbre de ciencia de datos de 2023, IDC y otras agencias de consultoría autorizadas también emitieron juicios: las empresas y organizaciones deben incorporar capacidades de ciencia de datos en sus futuras estrategias de desarrollo, y la plataforma de ciencia de datos básica se convertirá en la configuración estándar para la futura digitalización industrial.

 Como disciplina que se ha desarrollado durante más de cincuenta años, ¿por qué la ciencia de datos puede durar para siempre? En la ola de la inteligencia artificial, ¿por qué se ha destacado continuamente el valor de la ciencia de datos? Como dijo Su Meng, presidente y director ejecutivo de Percent Technology: "Después de experimentar la era de los datos pequeños y grandes, la ciencia de datos está entrando en la era 3.0 que abarca por completo la ola de la IA. La ciencia de datos acelerará el avance de la tecnología digital de la organización". capacidades de inteligencia".

Adopte por completo la era de la ciencia de datos 3.0

"La razón clave por la que ChatGPT funciona tan bien es que la calidad de los datos es muy alta y se puede entrenar para lograr muy buenos resultados. Hoy en día, la base subyacente de la IA es la ciencia de datos", cuando Wu Lianfeng, vicepresidente y analista jefe de IDC China, habló sobre las capacidades de la ciencia de datos, por ejemplo.

De hecho, la ciencia de datos, como un campo que utiliza métodos científicos para extraer significado e información de los datos, integra matemáticas, estadísticas, tecnología informática, inteligencia artificial y conocimiento del dominio. El objetivo principal es darse cuenta del valor de los datos en el lado comercial. Hoy, con el desarrollo profundo de la transformación digital y la aceleración integral de la elementoización de datos, los usuarios prestan cada vez más atención a la creación de capacidades de ciencia de datos.

"La era actual de la ciencia de datos 3.0 está adoptando por completo la ola de la IA". Su Meng presentó: "Antes de esto, la ciencia de datos experimentó la era de los datos pequeños y la era de los grandes datos".

En la era de los datos pequeños, la ciencia de datos utiliza principalmente tecnologías como bases de datos relacionales, almacenes de datos y ETL, principalmente para datos estructurados, datos históricos y datos fuera de línea, centrándose en la integración de datos, el análisis descriptivo y las aplicaciones de BI en el ámbito comercial. ; En la era de los datos, Internet e Internet móvil han traído datos masivos no estructurados y cambios en las tecnologías de análisis y procesamiento de datos. Los marcos informáticos como Storm y Spark han mejorado en gran medida la profundidad, amplitud y velocidad del procesamiento de datos, y el aprendizaje automático ha convertirse en el núcleo de la ciencia de datos Medios técnicos importantes, la aplicación de la ciencia de datos de mercado se basa en tecnologías y escenarios de un solo punto.

"Los grandes datos se han convertido en un terreno fértil para la IA, y la IA es un usuario importante de los grandes datos. En esta ola de inteligencia artificial, la IA se ha convertido gradualmente en una nueva generación de infraestructura, y los datos multimodales deben analizarse, interpretarse y participar. en los escenarios de pronóstico y asistencia en la toma de decisiones", dijo Su Meng.

Por lo tanto, ingresar a la era de la ciencia de datos 3.0, ya sea por la complejidad de los datos, la velocidad del desarrollo iterativo de la tecnología o el grado de integración más profunda de varios escenarios con datos y tecnología, es muy superior al pasado, lo que significa que una sola herramienta y una sola tecnología Point ya no pueden satisfacer las demandas de los usuarios.

"Las soluciones de ciencia de datos de extremo a extremo se han convertido en la tendencia general", presentó Su Meng. De hecho, este es el caso. Las empresas nacionales y extranjeras como Plantir, Alteryx y Baifendian están comprometidas a mejorar e iterar el sistema de productos de la plataforma de ciencia de datos, creando soluciones de ciencia de datos de extremo a extremo, reduciendo la complejidad de las tareas subyacentes, como los datos. integración y limpieza de datos, y aceleración de la ciencia de datos Aterrizando en miles de industrias.

Entre ellos, DeepMatrix, la plataforma básica de ciencia de datos de Percentage Technology, merece especial atención.

DeepMatrix, estableciendo el punto de referencia para las plataformas básicas de ciencia de datos

Como dice el refrán, si un trabajador quiere hacer un buen trabajo, primero debe afilar sus herramientas.

En la actualidad, los usuarios en muchas industrias, por un lado, tienen escalas de datos cada vez más grandes, tipos de datos más extensos y ricos, y más y más islas de datos comunes; Mejora continua, por lo que la liberación completa de elementos de datos aún enfrenta muchos desafíos. .

Por ejemplo, según estadísticas relevantes, los datos globales actuales inyectados en los modelos de IA ni siquiera alcanzan el 1 %, y la publicación de elementos de datos tendrá un gran espacio en el futuro.

Sin duda, la plataforma básica de ciencia de datos es una herramienta poderosa para que los usuarios de la industria liberen el potencial de los elementos de datos. Gartner cree que, de cara al futuro, las plataformas de ciencia de datos y aprendizaje automático deben implementar actividades de ciencia de datos a lo largo del ciclo de vida y ser capaces de automatizar o mejorar el procesamiento de datos, la construcción de modelos y los servicios en línea; al mismo tiempo, también deben tener colaboración entre varias personas y amplias capacidades de código abierto e integración.

"La ciencia de datos no puede divorciarse de los escenarios reales. En esencia, la ciencia de datos es una tarea en equipo y se deben poseer tres competencias básicas: habilidades blandas, herramientas integradas y conocimiento del dominio, y la plataforma básica de ciencia de datos puede respaldar esto. Tres competencias básicas", dijo Liu Yijing, CTO de Baifendian Technology.

Por lo tanto, con base en la rica práctica de realización de valor de datos en múltiples industrias en los últimos trece años, Percent Technology ha construido gradualmente una plataforma básica de ciencia de datos: DeepMatrix, que ha precipitado cuatro etapas de planificación y diseño, gobierno de datos, análisis de modelado y datos. La aplicación, que cubre el ciclo de vida completo de la realización del valor de los datos, tiene seis capacidades principales: soporte integral de tipos de datos, capacidades perfectas de gobierno de datos, potentes capacidades de modelado de datos, capacidades de conocimiento de datos enriquecidos, capacidades de producción de conocimiento eficiente y conocimiento de dominio altamente reutilizable.

Se informa que la plataforma básica de ciencia de datos de DeepMatrix tiene dos características principales: una está basada en el conocimiento, que deposita continuamente en la plataforma conocimientos de ciencia de datos como conocimiento de procedimientos, conocimiento fáctico y conocimiento conceptual, resolviendo de manera efectiva los problemas de ciencia de datos que enfrenta el Transformación digital de empresas tradicionales Problema de arranque en frío. Por ejemplo, en términos de modelado de datos, DeepMatrix ha acumulado cientos de algoritmos de aprendizaje automático, modelos de dominio y admite análisis semánticos multilingües, la mayoría de los cuales han sido verificados por escenarios reales de la industria.

El segundo es inteligencia.DeepMatrix tiene un sistema de desarrollo auxiliar inteligente incorporado, que ayuda automáticamente a los desarrolladores a seleccionar soluciones y completar la adaptación de datos, y ajusta y mejora inteligentemente las soluciones, y se basa en inteligencia como la base de conocimientos y la comprensión semántica de los datos. gobernanza y otros enlaces La tecnología ayuda a los desarrolladores a mejorar la eficiencia. Por ejemplo, en términos de gobierno de datos, DeepMatrix tiene decenas de miles de estándares de datos de dominio, puede construir estándares y linaje de datos de manera inteligente y tiene servicios de datos de código cero.

"En el pasado, en la realización del valor de los datos en escenarios de un solo punto, todos a menudo confiaban en varios productos semi-herramienta; ahora, la tendencia de demanda de valor de datos de extremo a extremo es obvia, y un servicio integrado de ingeniería y Se necesita una plataforma básica de ciencia de datos orientada para ayudar a los usuarios a liberar completamente el potencial de los elementos de datos", agregó Liu Yijing.

Sin duda, para la construcción de la plataforma básica de ciencia de datos, DeepMatrix of Percent Technology ha marcado un punto de referencia. Percent Technology no solo tiene muchos años de experiencia práctica en la industria, sino que su plataforma básica de ciencia de datos ha sido bien refinada en una variedad de escenarios complejos; además, la plataforma básica de ciencia de datos de Percent ha sido ampliamente reconocida por las principales instituciones y ha sido preseleccionado muchas veces por el informe de la plataforma Forrester AI/ ML (inteligencia artificial/aprendizaje automático), y en la evaluación especial de la solución de plataforma intermedia de datos del Instituto de Tecnología de la Información y las Comunicaciones, 283 casos de uso pasaron el nivel excelente ( el más alto nivel) certificación.

El mercado de la ciencia de datos necesita líderes

"En la construcción de la China digital, la liberación de la productividad de los datos es la clave. Además de la construcción de hardware de infraestructura como la computación oriental y occidental, también es necesario construir una cultura de datos y promover el desarrollo de la ciencia de datos y otros. construcción de 'poder suave', para liberar completamente la productividad de los datos. Salga". Chen Songqi, profesor de la Facultad de Ciencias Matemáticas de la Universidad de Pekín y la Facultad de Administración de Guanghua, y académico de la Academia de Ciencias de China, dijo en el 2023 Data Science Cumbre.

Según la firma de investigación de mercado MarketsandMarkets, el tamaño del mercado de la plataforma de ciencia de datos global será de 95 300 millones de USD en 2021 y se espera que alcance los 322 900 millones de USD en 2026, con una tasa de crecimiento anual compuesto (CAGR) del 27,7 %. No hay duda de que con el rápido desarrollo de la economía digital de China, vale la pena esperar las perspectivas de aplicación de mercado, la tasa de crecimiento y el espacio futuro de la ciencia de datos de China.

Big Data Online cree que el mercado de la ciencia de datos de China está en ascenso, y el mercado necesita líderes de la industria para liderar el desarrollo saludable de la industria, acelerar la innovación tecnológica y la práctica de la industria, popularizar la cultura de la ciencia de datos y cultivar talentos. En comparación con jugadores integrales como Ali y Huawei, Percentage Technology se parece más a un jugador profesional en el campo de la ciencia de datos. Se ha centrado y centrado en el campo de la ciencia de datos durante muchos años y ocupa una posición de liderazgo en la ciencia de datos. mercado.

En primer lugar, Percent Technology se ha comprometido con la aplicación y exploración de la tecnología de ciencia de datos durante muchos años. Desde el mayor proveedor de servicios de tecnología de motores de recomendación en China, tomando la delantera en atender a más de 2000 clientes de comercio electrónico y medios de Internet con tecnología de ciencia de datos, hasta muy consciente del valor importante de los grandes datos en la transformación digital del campo To B , la tecnología, los productos y las aplicaciones de ciencia de datos acumulados para múltiples industrias, como las finanzas, el comercio minorista y los medios; y luego aplicar los productos y tecnologías de ciencia de datos acumulados en Internet y los servicios empresariales al campo de los asuntos gubernamentales, orientados a las ciudades digitales , seguridad pública, respuesta a emergencias, estadísticas, etc. Utilice la ciencia de datos para ayudar a mejorar las capacidades de gobernanza del gobierno y modernizar los sistemas de gobernanza.

En segundo lugar, Percent Technology otorga gran importancia a la construcción ecológica de la ciencia y la tecnología de datos. Tomando los estándares como ejemplo, Percent Technology participó en el Grupo de Trabajo de Estándares de Big Data e Inteligencia Artificial del Comité Beacon, participó en la formulación de una serie de estándares nacionales, como arquitectura y terminología de referencia de big data, y en el desarrollo de estándares de la industria como como gestión de emergencias y entorno ecológico, y continuó desarrollando su propio mejor La práctica se exporta a la organización estándar; además, Baifendian Technology también trabaja en estrecha colaboración con Huawei, Baidu Smart Cloud, JD Cloud y otros socios para promover conjuntamente el desarrollo sostenible de el ecosistema de ciencia y tecnología de datos.

En tercer lugar, Percent Technology siempre ha otorgado gran importancia a la construcción de una cultura de ciencia de datos. Tomando como ejemplo la capacitación de talentos, en respuesta a la desvinculación de la capacitación de talentos en ciencia de datos de las necesidades reales, Percent Technology se ha asociado con las principales universidades nacionales en los últimos años para lanzar conjuntamente un plan de integración de educación y producción de ciencia de datos, proporcionando años de experiencia práctica. , software, herramientas y los últimos casos Para colegios y universidades, brinda capacitación práctica para estudiantes universitarios.

En cuanto a la creación de capacidades de ciencia de datos de los usuarios de la industria, Percent Technology e IDC también publicaron el primer documento técnico de capacidad de datos avanzada de la industria "Using Data to Create Value and Intelligence to Stimulate Growth--Data Science Basic Platform White Paper", que brinda capacidades de ciencia de datos. para la mayoría de los usuarios de la industria La construcción, la formación del pensamiento de datos y la promoción de la cultura de datos proporcionan un importante valor de referencia.

"En el futuro, tecnologías como big data, IA, computación en la nube e interacción inteligente estarán profundamente integradas con el mundo físico, marcando el comienzo de la era nativa de los datos. Los modos de datos serán más ricos, de mayor calidad y más sensibles al tiempo. , y los algoritmos serán más avanzados, los requisitos de potencia informática serán más fuertes. Percent Technology seguirá comprometida con acelerar el avance de las capacidades de inteligencia digital con la ciencia de datos y el uso de la ciencia de datos para construir un mundo más inteligente ", dijo finalmente Su Meng.

Supongo que te gusta

Origin blog.csdn.net/dobigdata/article/details/130182458
Recomendado
Clasificación