Compartir caso | ¿Cómo hacer AIOps para una operación y mantenimiento inteligente en la industria financiera? Basta con leer este artículo.

Para construir un sistema de TI de dos estados, AIOps ya es una opción inevitable. La transformación digital de la operación y el mantenimiento es la tendencia general. La gradual onlineización de los negocios físicos plantea mayores requisitos para la estabilidad y seguridad de los sistemas de TI . Para los importantes problemas que enfrentan los bancos, la operación y el mantenimiento inteligentes se han convertido en la principal solución.

AIOps de operación y mantenimiento inteligente, según la última definición de Gartner, se refiere a la extracción y el análisis de datos de TI basados ​​en big data, aprendizaje automático y otras capacidades para brindar soporte a los productos de gestión de operación y mantenimiento de TI. En la actualidad, los principales escenarios de aplicación de AIOps en la industria bancaria incluyen alarmas precisas, detección de anomalías, localización de causa raíz y análisis de capacidad, que optimizan significativamente los costos de operación y mantenimiento y mejoran la eficiencia de operación y mantenimiento; al mismo tiempo, con base en -análisis profundo de los datos para optimizar la calidad de la operación y el mantenimiento, vale la pena explicarlo Además, para maximizar el valor de los datos de TI, la tendencia futura será integrar datos multidimensionales basados ​​en una plataforma unificada e interpretar la operación de TI y mantenimiento desde una perspectiva operativa global.

1. Antecedentes del caso

Un banco estatal (E Bank) es uno de los cinco bancos estatales más grandes. En los últimos años, E-Bank ha elevado la transformación digital al nivel estratégico del grupo, aprovechando al máximo las ventajas únicas de la tecnología financiera, aumentando continuamente la intensidad de la inversión en tecnología financiera y ha logrado resultados positivos en gestión de patrimonio, desarrollo digital, verde finanzas y otros niveles de negocio.

  • Coexisten múltiples problemas, y el sistema tradicional de operación y mantenimiento de los bancos necesita urgentemente una transformación y mejora

Con el avance continuo del proceso de transformación digital de E-bank, el sistema comercial bancario y la infraestructura se vuelven cada vez más complejos, y los datos de operación y mantenimiento aumentan día a día. La capacidad de operación y mantenimiento se ha convertido cada vez más en un enfoque importante. de la transformación digital de la banca electrónica. El crecimiento continuo del volumen de negocios ha traído los siguientes problemas a la operación y mantenimiento de TI tradicionales:

Primero, el gobierno de datos es difícil. Con la evolución de la digitalización y la profundización de la reforma bancaria, el volumen de negocios del banco electrónico ha aumentado, la escala de datos se ha expandido rápidamente y los tipos de datos y las estructuras de datos se han vuelto más complejos y diversos. estándares, la calidad de los datos es baja y los datos del banco electrónico dispersos en varias aplicaciones, la concentración no es alta, hay un fenómeno de isla entre los datos y falta la reutilización de los datos.

En segundo lugar, es difícil encontrar problemas. E-Bank ha establecido un sistema de operación y mantenimiento en el pasado, pero con la práctica continua de este sistema en los negocios, han surgido muchos problemas. En primer lugar, el monitoreo no es completo y carece del monitoreo del estado general de la operación del negocio; en segundo lugar, el sistema de monitoreo de operación y mantenimiento original utiliza alarmas de umbral fijo, que tiene una alta tasa de falsos positivos y falsos negativos; además, el El sistema original de operación y mantenimiento es relativamente pasivo para encontrar problemas y carece de predicción de tendencias. No puede identificar los problemas a tiempo antes de que los usuarios se vean afectados y depende en gran medida de la experiencia del personal de operación y mantenimiento, lo que resulta en altos costos de operación y mantenimiento y bajos costos de operación y mantenimiento. eficiencia.

En tercer lugar, es difícil localizar la causa raíz. El sistema original de operación y mantenimiento y las herramientas del Banco E son básicamente análisis estadístico posterior al evento, sin capacidades de análisis en tiempo real, capacidades de análisis de causa raíz impulsadas por indicadores comerciales, capacidades de análisis de correlación basadas en escenarios y análisis cruzado de multidimensional. datos tales como alarmas, indicadores y registros La capacidad para mejorar la capacidad de resolución de problemas de operación y mantenimiento es muy limitada, lo que resulta en una baja capacidad de resolución de problemas de operación y mantenimiento.

En cuarto lugar, el análisis operativo es difícil. El sistema tradicional de operación y mantenimiento de E Bank se basa principalmente en la experiencia manual y analiza los datos a través de informes, careciendo de medios inteligentes para el análisis dinámico de datos; el análisis de datos de operación y mantenimiento anteriores es principalmente desde la perspectiva de la operación y el mantenimiento en lugar de la perspectiva de negocio, lo que resulta en el análisis de datos Es relativamente unilateral, no fuerte en la implementación, y la extracción de valor de los datos no es suficiente, por lo que no puede proporcionar un soporte de garantía para operaciones integrales.

Además, E-bank también tiene algunos requisitos personalizados. E-bank ha implementado una plataforma en la nube, que es diferente de la arquitectura técnica tradicional.La plataforma en la nube presenta más requisitos en el lado de la operación y el mantenimiento, como una integración profunda con herramientas de visualización y conciencia situacional para identificar y resolver riesgos de seguridad. en la nube; También hay requisitos para las capacidades de seguridad. Con el aumento en el volumen de negocios, aumenta la probabilidad de operaciones ilegales internas. E-Bank presenta nuevos requisitos para la detección e investigación de operaciones ilegales del personal interno. La capacidad de integrar la seguridad Los datos se han convertido en un foco importante de E-Bank.

En resumen, con la ayuda de ciertos medios y métodos, podemos realizar una gestión completamente centralizada de los datos de operación y mantenimiento de TI del cliente, realizar procesamiento de datos en tiempo real, análisis y predicción inteligentes, realizar una localización multidimensional y eficiente de la causa raíz, y realizar la actualización integral del lado de operación y mantenimiento.Se ha convertido en una demanda importante para la transformación digital de E-bank. En base a esto, E-bank decidió cooperar con Qingchuang Technology para llevar a cabo una exploración en profundidad de AIOps de operación y mantenimiento inteligente.

Fundada en Shanghái en 2016, Qingchuang Technology es el primer proveedor de soluciones de aterrizaje AIOps de operación y mantenimiento inteligente en China. Qingchuang Technology se centra en potenciar la gestión de operaciones y mantenimiento con IA, activando la sabiduría de los datos de operación y mantenimiento y ayudando a los clientes con la transformación digital. En la actualidad, su base de clientes abarca muchas industrias, como banca, seguros, valores, manufactura, energía y transporte.

Basado en sus poderosas capacidades de big data, capacidades de procesamiento integrado de flujo por lotes y capacidades de algoritmos de IA, la tecnología Qingchuang proporciona múltiples niveles desde la capa de gobierno de datos (incluida la recopilación de datos, el procesamiento de datos y el almacenamiento de datos), la capa de aplicación de operación y mantenimiento y capa de toma de decisiones de operación E-bank proporciona una solución integral para la operación y el mantenimiento inteligente Sherlock AIOps.

2. Estrategias de implementación específicas

1. Construir una plataforma de operación y mantenimiento digital para mejorar integralmente las capacidades de gobierno de datos del banco

Los datos son la base de la construcción de la escena. Por lo tanto, en términos de gestión de datos, Qingchuang ha construido un centro de operación y mantenimiento digital para E-bank que integra múltiples funciones de recopilación, procesamiento y almacenamiento de datos.

El primero es la recopilación de datos de múltiples fuentes. Sherlock AIOps tiene la capacidad de recopilar datos de múltiples fuentes de datos, como lagos de datos, API y datos de clientes, que cubren varios datos de operación y mantenimiento, como indicadores, eventos y registros. Ya sea que provenga del sistema de órdenes de trabajo, del sistema de monitoreo o de la plataforma de registro, puede integrarse en la plataforma como una fuente de datos configurable. Además, la recopilación de datos se conectará a diferentes sistemas, como la nube de contenedores, K8, etc.

En segundo lugar, una vez completada la recopilación de datos, se requiere el procesamiento de datos. Sobre la base de las dos pilas de tecnología principales, Flink y Spark, se realiza la abstracción, y las dos se integran para formar una plataforma digital de operación y mantenimiento, lo que hace que la plataforma abarque el desarrollo especializado del procesamiento por lotes de flujo. Al mismo tiempo, utilice herramientas de visualización para lograr el etiquetado, la sistematización y la estandarización de los datos, de modo que los datos se puedan arrastrar y soltar para lograr un procesamiento básico y un análisis de consulta integrado.

En tercer lugar, mejorar la capacidad de almacenamiento de datos de operación y mantenimiento. Una vez que se completa el procesamiento de datos, es necesario almacenar los datos procesados. Qingchuang Technology proporciona la pila de tecnología correspondiente y el software de soporte para el almacenamiento de datos de operación y mantenimiento de E-bank, y también utiliza herramientas de big data para ayudar a E-bank a mejorar sus capacidades de almacenamiento de datos de operación y mantenimiento.

En general, la plataforma de operación y mantenimiento digital construida por Qingchuang Technology para E-Bank proporciona tres servicios para la construcción de escenarios de operación y mantenimiento inteligentes: procesamiento de big data, procesamiento integrado de flujo por lotes y plataforma de algoritmo de IA, sentando las bases para E -Operación y mantenimiento inteligente del banco. Al mismo tiempo, mejora continuamente la calidad y el nivel de gobierno de sus datos de operación y mantenimiento, y resuelve el difícil problema del gobierno de datos del banco electrónico.

2. Escenarios de operación y mantenimiento inteligentes diversificados para ayudar a descubrir problemas y localizar las causas raíz

Sobre la base de la plataforma de operación y mantenimiento digital, la capa de aplicación de operación y mantenimiento de Sherlock combina docenas de algoritmos para ayudar a E-Bank a construir de manera flexible una variedad de escenarios de operación y mantenimiento inteligentes y producir los resultados de análisis que necesita.

Los escenarios de operación y mantenimiento inteligentes incluyen la supresión automática de alarmas, el descubrimiento de escenarios de fallas, la detección de anomalías de índice, la detección de anomalías de registro, la ubicación integral de la causa raíz, el análisis empresarial multidimensional, el análisis y la predicción de capacidad, etc., principalmente resumidos en cuatro aplicaciones de productos principales: alarma centro de identificación y análisis, centro de análisis de índices, centro de análisis de registros y experto en análisis rápido de Rizhi.

Impulsado por algoritmos de aprendizaje automático, el centro de análisis e identificación de alarmas realiza análisis de correlación y reducción de ruido en una gran cantidad de eventos de alarma, lo que ayuda a E-bank a realizar la predicción de problemas y la ubicación de la causa raíz.

Basado en anomalías de transacción, asociaciones de indicadores, integración de topología y capacidades de recomendación de causa raíz, el Centro de análisis de índices ayuda a E-Bank a descubrir y predecir rápidamente fluctuaciones anormales en los indicadores y determinar la correlación entre indicadores para ayudar a localizar la causa raíz.

El centro de análisis de registros tiene una variedad de plantillas listas para usar y capacidades de análisis inteligente, lo que ayuda al banco electrónico a analizar de manera integral el estado general del negocio digital y mejora sus capacidades de operación y mantenimiento, como la ubicación de la causa raíz de fallas, auditoría de registro y detección anormal.

Por otro lado , los expertos de Rizhi Quick Analysis han realizado la agrupación de registros masivos en un número legible a simple vista, identificando de manera inteligente patrones de ocurrencia de registros, analizando excepciones de registros y alertando de manera inteligente, ayudando así a E-Bank a encontrar problemas y localizar causas raíz sin conocer la estructura del registro. A través de la construcción de las cuatro aplicaciones principales, E-Bank puede descubrir anomalías rápidamente y localizar la causa raíz, mejorando así la eficiencia operativa.

En el futuro, sobre la base de la operación y el mantenimiento inteligentes, la tecnología de Qingchuang también ayudará a E-Bank a dar el salto de la operación y el mantenimiento inteligentes a la operación inteligente. Qingchuang Technology interpreta la operación y el mantenimiento de TI desde la perspectiva de la operación global. Sobre la base de la apertura de los datos globales de E-bank, lo ayuda a personalizar el centro de toma de decisiones de operación exclusivo, con precisión, en tiempo real y muestra dinámicamente la el estado de operación del sistema y, a través de la extracción de datos, el análisis de valor respalda de manera efectiva la toma de decisiones operativas y destaca la influencia de la operación y el mantenimiento en el negocio.

3. La solución integral AIOps de Sherlock ayuda a los bancos a lograr una operación y un mantenimiento eficientes

A través de la implementación de la solución integral Sherlock AIOps, Qingchuang Technology ayudó a E-Bank a resolver varios problemas y logró una operación y mantenimiento eficientes e inteligentes:

En primer lugar, se han mejorado las capacidades de calidad y gobierno de datos. Mediante el uso de la plataforma digital de operación y mantenimiento para el gobierno de datos y la gestión centralizada de datos de operación y mantenimiento, se rompieron las barreras de datos, se mejoró considerablemente la estandarización de datos, se mejoró la calidad de los datos y se brindó soporte para el análisis y la aplicación de datos posteriores. .

En segundo lugar, se ha mejorado la capacidad de descubrir problemas. Al implementar la plataforma inteligente de operación y mantenimiento Sherlock AIOps, E-Bank ha reducido la tasa de falsas alarmas y la carga de trabajo del personal de primera línea en función de las cuatro principales aplicaciones inteligentes de operación y mantenimiento, y ha mejorado en gran medida la velocidad de detección temprana de anomalías y advertencia de capacidad

En tercer lugar, para lograr una localización eficiente de la causa raíz. E-Bank utiliza la detección de anomalías del índice de transacciones y el análisis de correlación con una variedad de anomalías del índice de infraestructura, combinadas con la correlación de topología y la resolución de problemas de patrones de anomalías de registro, para lograr una resolución de problemas eficiente y completa de las fuentes de fallas al minuto.

En cuarto lugar, se ha mejorado la capacidad de analizar operaciones. A través de la construcción de operaciones y mantenimiento inteligentes, E-bank ha realizado una gestión integral y un análisis inteligente de alarmas, registros y varios indicadores, ha reducido los riesgos operativos en aproximadamente un 70 %, ha aumentado la eficiencia operativa en unas 6 veces y ha logrado un SLA general ( nivel de servicio) del centro de datos.


​Qingchuang Technology, proveedor de referencia en el campo de AIOps continuamente recomendado por Gartner. La compañía se compromete a ayudar a los clientes empresariales a mejorar la comprensión de los datos de operación y mantenimiento, optimizar la eficiencia de la operación y el mantenimiento y reflejar completamente la influencia de la operación y el mantenimiento de la tecnología en las operaciones comerciales.

La elección común de los clientes líderes en la industria

Obtenga más información sobre la operación y el mantenimiento de productos secos y el intercambio de tecnología

Puedes seguir con un clic en la esquina superior derecha

Hemos estado profundamente involucrados en el campo de la operación y el mantenimiento inteligente durante casi diez años.

Proveedor de evaluación comparativa de AIOps recomendado por Gartner durante años consecutivos

nos vemos la próxima vez

Supongo que te gusta

Origin blog.csdn.net/qq_37641528/article/details/130087146
Recomendado
Clasificación