Aliyun Liu Weiguang: 20.000 palabras para interpretar el nativo de la nube a nivel financiero

Autor: Liu Weiguang, presidente de Alibaba Cloud Intelligent New Finance & Internet Industry, director ejecutivo de China Finance Forty Forum, graduado del Departamento de Ingeniería Electrónica de la Universidad de Tsinghua

01 Prefacio

Cuando se propuso el concepto nativo de la nube en 2015, detrás de la informatización y la digitalización formadas por el desarrollo centenario de las finanzas globales en ese momento, el nivel de servicio técnico de nivel financiero formó un estándar de consenso de la industria después de un largo período de pulido. . El concepto clásico de nube nativa hace ocho años es un nuevo paradigma de desarrollo de software que se centra en la contenedorización, DevOps, el desarrollo continuo y la integración continua, y la arquitectura de microservicios. Los requisitos de nivel financiero, como alta disponibilidad, alto rendimiento, continuidad comercial, seguridad y estabilidad del sistema, etc., parecen estar en dos categorías distantes del concepto de arquitectura nativa de la nube. Con la continua evolución del nivel técnico, en el desarrollo de nuevos sistemas de aplicaciones, las instituciones financieras han comenzado a introducir gradualmente arquitecturas de implementación nativas de la nube, como la contenedorización, pero siempre han descubierto que las capacidades nativas de la nube centradas en el estado de desarrollo no pueden tocar construcción del sistema financiero de todos los niveles. A su vez, los rápidos cambios en la tecnología de computación en la nube han promovido el desarrollo de la nube nativa de un sentido estricto a un sentido amplio. La nube de hoy se ha convertido en una infraestructura estándar más universal y una plataforma para nuevas tecnologías e innovación empresarial; por lo tanto, como la nube Las tecnologías nativas como big data, almacenamiento nativo en la nube y tecnología de red nativa en la nube permiten que las capacidades nativas de la nube se extiendan desde el desarrollo de software hasta las plataformas de datos y luego a la arquitectura de implementación física subyacente. La computación en la nube de hoy, ya sea una nube pública o una nube privada, está cambiando la planificación orientada al futuro de la industria debido al avance que trajo su sistema técnico y la adopción y el soporte del código abierto.

Después de un largo período de exploración y práctica, proponemos un concepto completamente nuevo: nativo de la nube de grado financiero. La idea central es cambiar el concepto nativo de la nube de un sentido estricto a uno amplio, y extender el pensamiento avanzado de la nube. -nativo desde solo cubrir el desarrollo de aplicaciones hasta la arquitectura de implementación física del sistema.El enlace técnico completo, desde el estado de desarrollo simple hasta el estado de diseño + estado de investigación y desarrollo + estado de operación + estado de operación y mantenimiento + estado de recuperación de desastres, mientras combina el nivel financiero alta disponibilidad, alto rendimiento, continuidad del negocio, etc. en cada categoría Características, resumidas y definidas en un paradigma de arquitectura nativa de la nube full-stack a nivel financiero. Dicho paradigma de arquitectura combinará en gran medida el concepto de arquitectura técnica más avanzada con el SLA de nivel financiero más estricto, con el objetivo de describir un sistema técnico para actualizar las capacidades nativas de la nube de pila completa, reemplazando por completo la arquitectura tradicional y en el rápido desarrollo de digital. finanzas Hoy, en la era de la nube de la inteligencia artificial, puede proporcionar el soporte más poderoso.

02 Desarrollo de arquitectura informática financiera

Si el banco es Iron Man, entonces el sistema de TI es su traje.

En los últimos 40 años, con el desarrollo comercial y la transformación de la industria financiera representada por los bancos, la estructura general del sistema de TI también ha pasado por múltiples rondas de evolución iterativa. El proceso de desarrollo de la información del banco se puede resumir en cuatro etapas principales: -era de la soledad, era de las redes y en línea, era de la concentración de datos y era de la nube nativa distribuida.

1) Era independiente : las computadoras se utilizan para reemplazar el trabajo manual, pero no hay interconexión de información, y cada rama es un "libro mayor electrónico" separado, que se convierte en una isla de información.

2) La era de la creación de redes : basándose en la infraestructura de red completa, los bancos confían en ciudades medianas regionales, centrándose en anfitriones provinciales y municipales, vinculando el negocio de varios puntos de venta para realizar la interconexión provincial y municipal.

3) La era de la centralización de datos : los bancos, según su propio desarrollo, centralizan datos y negocios en diversos grados, y realizan la centralización de la infraestructura del sistema, servidores físicos, datos y aplicaciones.

En la era de la gran concentración de datos, también es un período en el que la informatización de TI de los bancos se desarrolla más rápido y promueve más el negocio. Lo más importante en la construcción de todo el sistema de TI es el "sistema central". Sistema central: Sistema bancario central, donde CORE significa Intercambio en tiempo real en línea centralizado, que también es la abreviatura de "transacción en línea en tiempo real centralizada". Tomando como ejemplo el pago por transferencia, se ha reducido del medio mes original a "Segunda llegada en tiempo real" Es a través de la gran concentración de datos y la construcción de capacidades de transacciones en línea en tiempo real del sistema central que los servicios financieros de China han mejorado enormemente sus capacidades de servicio y eficiencia de transacciones. La riqueza comercial, el volumen de transacciones comerciales y el volumen de datos de los bancos alcanzan constantemente nuevos máximos. Al mismo tiempo, el sistema central, que sirve como piedra angular del banco, plantea desafíos extremadamente altos y desafíos para el rendimiento del procesamiento, la estabilidad, y seguridad de los sistemas de TI. En ese momento, las empresas de TI nacionales todavía no podían permitirse requisitos tan extremadamente altos, y la única opción para la arquitectura de TI de los bancos era la arquitectura centralizada.

4) Era nativa de la nube distribuida : con la expansión continua de las formas comerciales financieras, continúan surgiendo defectos como la escalabilidad insuficiente de la arquitectura centralizada, las capacidades de respuesta de alta concurrencia al estilo de Internet insuficientes, los altos costos y los requisitos de investigación y desarrollo independientes. Al mismo tiempo, la tecnología nativa de la nube distribuida también se está moviendo gradualmente de la plataforma de servicios de Internet del banco a la arquitectura técnica del sistema central, convirtiéndose gradualmente en la nueva generación de arquitectura técnica principal del banco.

imagen.png

Características de la arquitectura centralizada: La arquitectura centralizada también se refiere al paradigma de la arquitectura del sistema dominado por IBM, Oracle y EMC. El mainframe/minicomputadora de IBM, la base de datos de Oracle y el almacenamiento de EMC siempre han sido tableros cortos de suministro doméstico, altamente dependientes de La arquitectura centralizada es el sistema de arquitectura central. La característica más importante de la arquitectura centralizada es que la estructura de implementación es simple. El hardware subyacente generalmente usa mainframes, minicomputadoras y computadoras todo en uno costosas compradas a IBM, HP, Oracle y otros fabricantes. No es necesario considerar cómo implementar servicios en múltiples nodos, y no es necesario considerar el "problema de colaboración distribuida" entre nodos. Generalmente, el método de "expansión vertical y vertical" se adopta para mejorar la capacidad de procesamiento del sistema al aumentar la configuración de recursos de una sola máquina y para mejorar la disponibilidad del sistema al aumentar el mecanismo de clúster de dispositivos de hardware y software básico.

Las características de la arquitectura distribuida: el sistema está compuesto por múltiples módulos desplegados en diferentes computadoras de la red, y el sistema se comunica y coordina entre sí a través del paso de mensajes a través de la red. El sistema distribuido adopta el método de "expansión horizontal horizontal" para mejorar la capacidad operativa del sistema aumentando la cantidad de servidores. En teoría, la capacidad operativa se puede expandir infinitamente. El sistema distribuido adopta la implementación del clúster, y cada nodo del clúster es una unidad operativa independiente, y la cantidad de nodos se puede aumentar o disminuir en cualquier momento según el tamaño de la tarea. La falla de un solo nodo no afectará la disponibilidad general.

03 Las empresas financieras aceptan los problemas y conflictos de la nube nativa

"El diseño no se trata de hacer las cosas bonitas, se trata de hacer que las cosas funcionen mejor". Del mismo modo, la nube nativa no es por moda, sino para resolver problemas.

Alibaba propuso una arquitectura descentralizada en 2009 y básicamente completó la arquitectura descentralizada en 2013.

En términos de hardware, use servidores X86 estandarizados para reemplazar las minicomputadoras de IBM y los dispositivos de almacenamiento de EMC para resolver la presión de la expansión del rendimiento.

En términos de software, use OceanBase y MySQL de código abierto en lugar de la base de datos Oracle.

En términos de sistema, se construyó un nuevo sistema utilizando la idea de arquitectura nativa de nube distribuida.

En el proceso de descentralización de la arquitectura, Ali no solo resuelve problemas informáticos a gran escala con servidores de PC baratos y relativamente controlables, sino que también promueve la madurez y la amplia aplicación de tecnologías nativas de la nube. Con la iteración y el desarrollo continuos de los negocios y la tecnología en la industria financiera, la tecnología nativa de la nube distribuida no solo debe cumplir con los requisitos de alto rendimiento, alta confiabilidad, alta flexibilidad y altos estándares, sino que también debe centrarse en la seguridad, el riesgo costos de capacidad, rendimiento y capacidad En términos de consideraciones de diseño de arquitectura en toda la empresa, tenemos que enfrentar los siguientes 8 problemas principales.

Pregunta 1: ¿Qué es la nube nativa? ¿Qué es la nube nativa de grado financiero?

La definición inicial de CNCF de nativo de la nube es un concepto estrecho, que se centra más en un nuevo paradigma a nivel de desarrollo de software. Se define como "nativo de la nube estrecha" con cuatro características: implementación en contenedores + arquitectura de microservicios + desarrollo continuo e integración continua + DevOps. ", el núcleo es para los desarrolladores de aplicaciones. Sin embargo, con la evolución continua de la computación en la nube, el almacenamiento nativo en la nube, la red nativa en la nube, la base de datos nativa en la nube, los macrodatos nativos en la nube, la IA nativa en la nube, la plataforma intermedia comercial nativa en la nube, etc. categoría unificada de nativo de la nube, por lo que el concepto se está expandiendo gradualmente, lo que indica que "nativo de la nube en el sentido estricto" todavía se enfoca en el nivel de desarrollo y aún no puede resolver completamente el problema de actualización de la arquitectura general del cliente, por lo que "nativo de la nube en el sentido amplio sentido" se ha formado.

Frente a los requisitos más estrictos de la industria financiera, es necesario resolver no solo el problema del desarrollo ágil, sino también la naturaleza avanzada de la arquitectura, e integrar las finanzas con el cumplimiento de la seguridad, la sólida consistencia de las transacciones, la expansión de unidades, desastres recuperación y multiactivo, y cadena completa Integración profunda con tecnología nativa de la nube para realizar la actualización de arquitectura general de la arquitectura centralizada tradicional y convertirse en un conjunto que no solo cumple con los estándares y requisitos de la industria financiera, sino también tiene las ventajas de la arquitectura de tecnología nativa, formando una "arquitectura nativa de la nube de nivel financiero".

imagen

Pregunta 2: ¿Dónde cambia la administración de operaciones y mantenimiento de TI nativa de la nube?

"Autos en la misma pista, libros en el mismo texto y caminatas en el mismo camino"

Desde la perspectiva de la evolución de la arquitectura de TI, aunque la arquitectura centralizada tradicional es fácil de implementar, existen divisiones de chimenea verticales y dispersión de gestión horizontal.Cada capa y cada producto técnico se gestionan y mantienen de forma independiente. Una vez que la tecnología de virtualización madura, se realiza una gestión centralizada y unificada desde el servidor subyacente, el almacenamiento, la red, la máquina virtual y otros niveles, lo que mejora en gran medida el radio de gestión del personal de operación y mantenimiento. El concepto central de la nube nativa es que todas las tecnologías de recursos se proporcionan en forma de agrupación y servicios, que ya no es la relación tradicional de suministro de recursos al estilo chimenea. La arquitectura nativa de la nube realiza aún más la estandarización y la gestión unificada de varios servicios técnicos, como recursos de IaaS, recursos de PaaS, bases de datos distribuidas, middleware distribuido, contenedores y procesos de I + D, y realmente realiza "vehículos en la misma pista, libros El mismo texto ", lo que reduce en gran medida la complejidad de la operación y el mantenimiento, y mejora la escala de los objetos de gestión per cápita.

imagen

Pregunta 3: ¿Cómo implementa el sistema nativo de la nube la gobernanza de código abierto?

En el pasado, si las empresas financieras querían usar tecnologías o productos nativos de la nube, necesitaban gastar mucha energía investigando algunos proyectos de código abierto, haciendo O&M y administración ellos mismos, y también necesitaban considerar cuestiones como la integración y las garantías de estabilidad, para construir una plataforma nativa en la nube. Las instituciones financieras han comenzado a darse cuenta de que el software de código abierto solo puede resolver requisitos funcionales explícitos por encima de la superficie y una gran cantidad de requisitos no funcionales implícitos debajo de la superficie. realmente deben tenerse en cuenta al crear aplicaciones nativas de la nube.

Con el fin de facilitar a los desarrolladores y al personal de operación y mantenimiento el uso de productos de tecnología nativa de la nube, cada vez más instituciones financieras han establecido un conjunto de estándares técnicos y plataformas tecnológicas nativas de la nube a nivel empresarial, desde la integración del producto, operación, monitoreo , operación y mantenimiento Gobernanza multidimensional de productos y arquitecturas, para realizar la adaptación e implementación de tecnología nativa de la nube con garantías SLA, casos maduros, especificaciones técnicas y escala de grises.

Pregunta 4: ¿Cómo se puede combinar la nube nativa con la innovación de aplicaciones de tecnología de la información para lograr 1+1>2?

Una pila completa de tecnología nativa de la nube de arriba hacia abajo representa el sistema tecnológico más avanzado en la actualidad. Por lo tanto, en la selección de soluciones técnicas para la "innovación de aplicaciones de tecnología de la información", no es solo una idea pura de hardware o un simple punto a punto. idea de reemplazo, pero se debe usar más La arquitectura de tecnología nativa de la nube más avanzada aprovecha la oportunidad de la transformación de "innovación de aplicaciones de tecnología de la información" para lograr actualizaciones de capacidad integrales.

La "innovación de aplicaciones de tecnología de la información" se ha convertido en un factor importante que no se puede ignorar en la construcción de los sistemas de TI de las instituciones financieras. Al construir sistemas nativos en la nube, se deben considerar los desafíos que plantean estos requisitos, como la "innovación de las aplicaciones de tecnología de la información". La estabilidad de la cadena de suministro de hardware y software Y la confiabilidad de los chips domésticos.

La "innovación en la aplicación de la tecnología de la información" inevitablemente hará que las instituciones financieras se enfrenten al "problema de fragmentación" de diferentes servidores de chips (lo que resultará en una mayor complejidad de gestión y mayores costos). Si cada tipo de clúster de chips se crea por separado para la gestión de la nube, esto multinube La fragmentación y diferenciación de los grupos de recursos dificulta que las aplicaciones nativas de la nube programen y usen los recursos de manera uniforme, y no pueden utilizar completamente los picos y valles de diferentes negocios para lograr elasticidad. Además, varias nubes también darán lugar a operaciones y mantenimiento complejos, incluida la implementación, la actualización y la expansión de la capacidad, que deben administrarse por separado, lo que genera altos costos de administración de operaciones y mantenimiento y una experiencia operativa deficiente.

Por lo tanto, "una nube con múltiples núcleos + nube nativa" se ha convertido en la solución óptima al problema de la fragmentación, y "una nube con múltiples núcleos" resuelve fundamentalmente el problema de la gestión de múltiples nubes causado por la coexistencia de diferentes tipos de chips ( la gestión unificada de la fragmentación, la integración de " La diferencia de "multinúcleo" se ha transformado en el servicio estandarizado de "una nube", y la nube nativa resuelve el problema de la integración de recursos (la combinación de recursos fragmentados pequeños y grandes). Maximice el uso de la poderosa potencia de cómputo del grupo de recursos en la nube, realice la integración de los recursos de potencia de cómputo de múltiples capacidades de clúster de chips y realmente forme una nube de 1+1>2.

imagen.png

Pregunta 5: ¿Cómo responde la arquitectura nativa de la nube a la producción de seguridad empresarial? 

De acuerdo con la "Ley de Murphy": "¡Duda de todo, cualquier falla de nodo ocurrirá!" ("Cualquier cosa que pueda salir mal, saldrá mal"). El principio de diseño de la arquitectura de aplicaciones nativas de la nube es considerar los posibles riesgos de "cisne negro" que afectan la producción segura como "normales".

La sugerencia de la arquitectura nativa de la nube es permitir que ocurran fallas, para garantizar que cada servidor y cada componente puedan fallar sin afectar el sistema y que tengan capacidades reemplazables y de recuperación automática. La falla inmediata (falla rápida y falla pequeña) es un principio de diseño importante de los sistemas nativos de la nube. La filosofía detrás de esto es que, dado que las fallas no se pueden evitar, cuanto antes se expongan los problemas, más fácil será para las aplicaciones recuperarse y menos problemas de entrada al entorno de producción. La esencia de Fail small es controlar el alcance de la falla: el radio de explosión. El enfoque cambiará de cómo agotar los problemas en el sistema a cómo descubrir rápidamente y manejar las fallas con gracia.

El riesgo técnico también es una prioridad principal para las arquitecturas nativas de la nube de grado financiero. Cualquier error en el procesamiento de transacciones puede dar lugar a pérdidas financieras impredecibles. Es necesario establecer un sistema de riesgo técnico profesional (SRE, Site Risk Engineering) para asegurar que desde la plataforma de arquitectura del sistema hasta el mecanismo de cultura de riesgo, en los aspectos de diseño de arquitectura, desarrollo de productos, cambio en línea, evaluación de estabilidad, falla localización y recuperación, etc. Asegurar el control de calidad del riesgo a lo largo del ciclo de vida, y dar una garantía integral ante cualquier cambio en el sistema.

Pregunta 6: ¿Cómo garantiza la arquitectura nativa de la nube la continuidad del negocio? 

Para las entidades financieras, cuando el negocio se pone en línea, lo más inaceptable es que el negocio no esté disponible.

La resiliencia nativa de la nube representa la resiliencia de todo el sistema cuando se producen diversas anomalías en los componentes de software y hardware de los que depende el sistema. Estas anomalías suelen incluir fallos de hardware, cuellos de botella de recursos de hardware (como el agotamiento del ancho de banda de la tarjeta de red/CPU), factores comerciales que tener un impacto fatal en la falta de disponibilidad del negocio incluyen tráfico que excede las capacidades de diseño de software, fallas y desastres que afectan el trabajo de la sala de computadoras, errores de software y ataques de piratas informáticos. La resiliencia interpreta la capacidad del sistema para proporcionar continuamente servicios comerciales desde múltiples dimensiones. El núcleo es mejorar la continuidad comercial del sistema en su conjunto y mejorar la resiliencia del sistema desde el diseño de la arquitectura nativa de la nube. Las capacidades de resiliencia nativas de la nube a nivel financiero incluyen: capacidades asincrónicas de servicio, reintento/limitación de corriente/degradación/fusión/contrapresión, modo maestro-esclavo, modo de clúster, alta disponibilidad dentro de AZ, unificación, recuperación ante desastres entre regiones, múltiples Live remotos. recuperación ante desastres, etc

Pregunta 7: ¿Cómo trata la arquitectura nativa de la nube la consistencia de las transacciones? 

La gente quiere usar un sistema distribuido como un sistema independiente, por lo que es inevitable enfrentarse al problema de la "coherencia distribuida".

"Micro" en los microservicios nativos de la nube significa que la granularidad del servicio se vuelve más pequeña y la complejidad de las transacciones financieras es relativamente grande. Por lo tanto, la coherencia de los datos en los sistemas nativos de la nube es un problema relativamente complejo. El almacenamiento de datos independiente en diferentes microservicios dificulta el mantenimiento de la coherencia de los datos. Dado que los errores de red en los sistemas de microservicios distribuidos son inevitables, según el teorema CAP, cuando se producen particiones de red, se requieren arquitecturas nativas de la nube para equilibrar la coherencia y la disponibilidad.

Por lo tanto, cuando planifique una arquitectura nativa de la nube a nivel financiero, también encontrará desafíos relacionados con la consistencia de los servicios financieros. Esta consistencia no solo se refleja en la lógica empresarial (TCC, SAGA, transacciones XA, colas de mensajes, etc.), sino también requiere más Garantía de consistencia a nivel de datos (consistencia multinodo, consistencia multicentro).

Pregunta 8: ¿Cuáles son los desafíos de la arquitectura nativa de la nube y el diseño y desarrollo de aplicaciones?

Lo que cansa a la gente no son las montañas lejanas, sino un grano de arena en el zapato.

Aunque la tecnología nativa de la nube tiene muchos beneficios, las instituciones financieras a menudo tienen una gran cantidad de sistemas existentes. Los sistemas técnicos de estos sistemas existentes suelen ser diferentes de las tecnologías nativas de la nube. ¿Cómo integrar y administrar los sistemas existentes y las nuevas aplicaciones nativas de la nube? ¿Cómo formular la estrategia de división de microservicios, cómo medir la dimensión de división, el estándar de división y la granularidad de división? ¿Cómo establecer un sistema observable nativo de la nube, implementar un monitoreo efectivo, gestión de registros y alarmas, monitorear el rendimiento de la aplicación y el uso de recursos en tiempo real, y localizar y resolver problemas rápidamente cuando ocurren?

Estos problemas desafían las soluciones profundas. Muchas instituciones financieras se dan cuenta de que la tecnología nativa de la nube necesita implementar especificaciones técnicas unificadas en los cinco estados de diseño, investigación y desarrollo, operación, operación y mantenimiento, y recuperación ante desastres. Capacidades y requisitos back-end como la operación y el mantenimiento, la recuperación ante desastres y la seguridad se consideran, diseñan y se utilizan como front-end en las etapas de diseño y desarrollo, y la tecnología nativa de la nube se utiliza para resolver la carga de trabajo humano back-end y la complejidad de la gestión.

04 "Nuevo estándar y nuevo modelo" para la nube nativa de nivel financiero

El proceso de desarrollo de la nube nativa de grado financiero

La precisión de las predicciones de Kevin Kelly sobre la tecnología moderna en "Fuera de control: el destino final y el fin de toda la humanidad" convirtió al autor en el rey profeta en los corazones de muchos profesionales de la tecnología, y este libro también se ha convertido en un libro sagrado. Dos puntos clave se destacan en la descripción del libro:

1. Un sistema complejo está compuesto por un gran número de sistemas simples independientes y autónomos.

2. Los movimientos complejos se ensamblan a partir de movimientos simples, no se modifican.

Todo el sistema está compuesto por múltiples "microsistemas" con responsabilidades únicas en diferentes niveles (microservicios), y el sistema en sí tiene tolerancia a fallas y libertad de iteración, lo que puede lograr una tolerancia a fallas dinámica como un todo. Lo más importante es que no hay una "mano de Dios centralizada" en el sistema. Esto coincide con el diseño de la arquitectura del sistema defendido por la nube nativa, e incluso el nacimiento de la nube nativa se inspiró en esto.

Como dice el refrán: "Cuando cae una ballena, todo crece".

Nativo de la nube es esencialmente el software, el hardware y la arquitectura nacidos de la nube. La nube nativa también es un proceso de desarrollo y evolución continuos. El concepto de nube nativa (Cloud Native) se propuso en 2015, y luego CNCF lo desarrolló y perfeccionó para formar un contenedor, entrega continua, integración continua, red de servicios, microservicios, base inmutable El concepto de instalaciones "estrechamente nativas de la nube" y API declarativas.

Hoy, cuando hablamos de "digitalización", en realidad hay dos conceptos, uno se llama original y el otro se llama transformación. Las tecnologías nativas de la nube en un sentido estricto cumplen principalmente con los nuevos requisitos de innovación ágil de las empresas "nativas digitales" basadas en Internet, en su mayoría aplicaciones basadas en Internet sin estado, y requieren consistencia final para la consistencia de los datos. Sin embargo, a menudo existen mayores obstáculos para los estándares técnicos existentes y los activos técnicos (carga) de las empresas financieras tradicionales de "transformación digital".

Con la continua profundización y popularización de la tecnología de computación en la nube, más y más nuevas tecnologías "nacen de la nube". Estos productos, tecnologías, software, hardware y arquitecturas que " nacen en la nube y son más largos que la nube" se han ido madurado y constituido Nace el concepto de "origen nuboso generalizado". En el futuro, seguirán surgiendo productos "nativos de la nube" que "nacen y crecen en la nube": una nueva generación de bases de datos, inteligencia artificial, almacenamiento, chips, redes y códigos de salud. La elasticidad extrema, la autonomía del servicio y la replicabilidad a gran escala de la nube nativa facilitan la estandarización de recursos heterogéneos, aceleran el lanzamiento de la productividad digital, aceleran la velocidad iterativa de las aplicaciones empresariales y promueven la innovación empresarial. Es la "mayor certeza" entre las muchas incertidumbres de la era digital, y su fuerte inclusión representa la dirección general de la arquitectura técnica de las futuras empresas digitales. Además de los requisitos de innovación ágil para la arquitectura técnica de las "empresas nativas digitales", la tecnología nativa de la nube generalizada también tiene en cuenta los estándares técnicos y los requisitos de compatibilidad de la arquitectura de las "empresas de transformación digital" tradicionales, por lo que tiene una gama más amplia de aplicabilidad de la arquitectura y mejores capacidades de servicio a nivel empresarial.

imagen.png

Hoy en día, a medida que la nube nativa pasa gradualmente de la comunidad a las instituciones financieras y se vuelve cada vez más popular entre las personas, las instituciones financieras comienzan a estudiar cómo combinar los requisitos de los escenarios financieros con la implementación nativa de la nube: cumplimiento de la seguridad financiera, consistencia sólida en las transacciones, la expansión de la unidad, la recuperación ante desastres y la gestión de riesgos empresariales multiactiva y de enlace completo, la gestión de operación y mantenimiento y otros requisitos de la industria están profundamente integrados con la tecnología nativa de la nube para desarrollar un conjunto de "arquitectura nativa de la nube de grado financiero". Puede cumplir mejor con los estrictos desafíos y requisitos del entorno de TI de nivel financiero y brindar soporte de arquitectura técnica unificada para las aplicaciones tradicionales de "aplicaciones estables" (transformación digital) y "aplicaciones sensibles" (nativas digitales) de las instituciones financieras.

Si tomamos el control unificado de la arquitectura financiera centralizada (cerebro central) en el pasado como "izquierda", y la nube nativa distribuida de código abierto completamente como "derecha". Bajo la arquitectura nativa de la nube financiera, la arquitectura técnica que necesitan las instituciones financieras es buscar un equilibrio entre la izquierda y la derecha, para lograr: no solo seguridad de nivel financiero, consistencia sólida y confiabilidad, sino también tolerante a fallas, escalable, y rápida capacidad de respuesta. Proponer una arquitectura de "autonomía local fuerte, control central débil" para proteger la complejidad de la aplicación (por ejemplo: arquitectura GRC, sistema global G-Global, sistema regional R-Region, sistema local C-City) y solo aquellos que necesitan ser juzgados por factores integrales El sistema global (cerebro central) completa la lógica compleja para reducir la carga en el sistema central, mientras que una gran cantidad de juicios simples diarios y acciones de ejecución se completan en un circuito cerrado en el sistema local para mejorar la tolerancia a fallas y la solidez del sistema en general.

imagen.png

10 nuevos elementos que definen la nube financiera nativa

La arquitectura nativa de la nube es un conjunto de principios arquitectónicos y patrones de diseño basados ​​en tecnología nativa de la nube, cuyo objetivo es maximizar la separación de las partes del código no comercial en las aplicaciones de la nube, de modo que las instalaciones de la nube puedan hacerse cargo de una gran cantidad de elementos originales no funcionales. características en las aplicaciones (como elasticidad, tenacidad, seguridad, observabilidad, escala de grises, etc.), sin el problema de la interrupción del negocio no funcional, hace que el negocio sea liviano, ágil y altamente automatizado. En la arquitectura tradicional, la capa de la aplicación tiene más códigos no comerciales, en la arquitectura nativa de la nube, la situación ideal es que no se reflejen códigos no funcionales en la lógica del código de la aplicación, sino que se hundan en la infraestructura. y el personal de mantenimiento solo necesita concentrarse en las partes relacionadas con el código comercial. Resumimos el núcleo de la nube nativa de nivel financiero en los siguientes 10 elementos arquitectónicos principales.

imagen.png

Elemento 1: Ingeniería de plataforma e infraestructura inmutable

Ante el uso a gran escala de la tecnología nativa de la nube, reducir la complejidad de la investigación y el desarrollo y la operación y el mantenimiento de las instituciones financieras es un gran obstáculo que restringe la implementación de la tecnología nativa de la nube. En la actualidad, desde la perspectiva de la gestión de I+D y la gestión de operaciones y mantenimiento, la "ingeniería de plataforma" y la "infraestructura inmutable" son dos capacidades clave nativas de la nube que pueden reducir en gran medida la complejidad.

La filosofía de DevOps es "quién construye, quién ejecuta", los desarrolladores deberían poder desarrollar, implementar y ejecutar sus aplicaciones de principio a fin. Pero para la mayoría de las instituciones financieras, esto en realidad no es fácil de lograr. La división del trabajo efectiva comprobada (Ops y Dev) tiene requisitos relativamente más bajos para los talentos, pero con la promoción del paradigma DevOps, el personal de I + D debe saber todo bien, lo que aumenta en gran medida la "carga cognitiva". Esto impone grandes exigencias a los equipos de I+D de las instituciones financieras, lo que no es propicio para la construcción de talentos universales y también dificultará en gran medida la introducción integral de aplicaciones nativas en la nube por parte de las instituciones financieras. Si una de las direcciones de mejora más probables es la ingeniería de plataformas, la ingeniería de plataformas es el puente entre DevOps y los programadores de negocios. Una plataforma de autoservicio que permite a los desarrolladores entregar software comercial más rápido y mejor. A través de operaciones simples basadas en páginas, la configuración en serie de este enlace se puede completar, por lo que I + D no necesita prestar atención a los detalles de muchas herramientas de operación y mantenimiento, y puede enfocarse en el desarrollo de funciones de aplicación. Descripción de ingeniería de plataforma de Gartner: "Las herramientas, las capacidades y los procesos que reúne la plataforma son cuidadosamente seleccionados por expertos en el dominio y empaquetados para la comodidad del usuario final. El objetivo final es crear una experiencia de autoservicio sin fricciones que brinde a los usuarios la solución adecuada". capacidades para ayudarlos a realizar el trabajo importante al menor costo, aumentando la productividad del usuario final y reduciendo su carga cognitiva".

La infraestructura variable tradicional se refiere al despliegue de servicios de aplicaciones basados ​​en máquinas físicas o servidores virtuales.La construcción del entorno operativo depende de muchas variables, como la configuración en algunos servidores, el software básico, etc., que pueden configurarse o distribuirse dinámicamente. entre diferentes entornos. Acceso en tiempo real a servicios externos para actualizar el estado de la aplicación. La infraestructura en la que se basa todo el servicio de la aplicación cambia constantemente. Cuando ocurre un escenario que requiere reversión de emergencia, el proceso de procesamiento del personal de operación y mantenimiento a menudo es complicado y propenso a errores.

Infraestructura inmutable nativa de la nube significa que, según la solución de duplicación nativa de la nube, la infraestructura de la que depende la aplicación (sistema operativo, script de seguridad, agente de operación y mantenimiento, marco de desarrollo, entorno operativo, etc.) se empaqueta en una imagen inmutable. Solo necesita confiar en la imagen para extraer el contenedor, lo que reduce en gran medida los costos de implementación y operación y mantenimiento de la aplicación, hace que la implementación, la operación y el mantenimiento de la aplicación sean más fáciles y predecibles y, al mismo tiempo, la aplicación ambiente operativo también logra mayor consistencia y confiabilidad. Además, las funciones de operación y mantenimiento, como el reemplazo de rotación automática y la reversión automática, se pueden realizar en función de la imagen, lo que mejora en gran medida el nivel de automatización de la operación y mantenimiento de la aplicación. Por un lado, el nivel de gestión de imágenes se puede mejorar a través de capas de imágenes. Por otro lado, las capas de imágenes pueden mejorar la eficiencia de carga de imágenes hasta cierto punto de acuerdo con el principio de imagen de carga de contenedores, lo que aumenta la velocidad de inicio de la aplicación.

imagen.png

Elemento 2: Nube híbrida elástica

A medida que la arquitectura de la nube se convierte en la plataforma y la infraestructura principales de las instituciones financieras, tiene la capacidad de escalar de manera elástica según la demanda de acuerdo con las unidades de negocios, y puede expandirse rápida y elásticamente para mejorar los recursos y las capacidades de procesamiento de aplicaciones cuando enfrenta picos de tráfico, y puede liberarse rápidamente después del pico de tráfico de aplicaciones para lograr la máxima utilización de los recursos, por lo que es necesario construir una arquitectura elástica que sea flexible y se pueda replicar a bajo costo. La esencia de la arquitectura elástica es la extensión de la arquitectura unificada, que brinda la capacidad de realizar un escalado elástico con la menor granularidad de la unidad de negocio en la arquitectura unificada, que incluye principalmente elementos emergentes y rebotes. Pop-up es una ventana emergente integral de recursos informáticos, redes, aplicaciones y niveles de datos basados ​​en unidades comerciales. Es un medio elástico general desde los recursos de nivel inferior hasta el tráfico de capa superior. Las unidades emergentes se denominan negocios elásticos. unidades. A diferencia de las unidades de negocio ordinarias, las unidades de negocio flexibles tienen las siguientes características:

Localidad: Cada unidad de negocios expandida en el modo normal necesita contener todas las aplicaciones y todos los datos, mientras que la unidad de negocios elástica que aparece bajo la arquitectura elástica solo necesita contener parte de la aplicación y parte de los datos en la unidad, generalmente un aplicaciones relacionadas con enlaces de alto tráfico involucradas.

Temporal: a diferencia del largo ciclo de vida de las unidades de negocios ordinarias, el ciclo de vida de las unidades de negocios flexibles es relativamente corto. Después de soportar el "Double Eleven" y otros grandes picos de pago promocional, las solicitudes de negocios de las unidades de negocios flexibles volverán a ser regulares. unidades de negocio, y luego libere las unidades de negocio elásticas para ahorrar costos.

Cross-cloud: Las unidades de negocios de Elastic generalmente se encuentran en una o varias nubes. Los picos de tráfico que enfrentan los escenarios que usan arquitecturas elásticas son varias veces más altos que los diarios. Es difícil que la base de computación en la nube diaria proporcione suficientes recursos. En este tiempo, se requieren otras bases de computación en la nube para proporcionar una gran cantidad de soporte de recursos.

La arquitectura elástica aprovecha al máximo las ventajas de la nube híbrida. Los recursos masivos de la nube permiten que las aplicaciones se expandan infinitamente para hacer frente a los picos de tráfico extremadamente altos. Una vez que se alcanzan los picos de tráfico, los recursos se pueden liberar rápidamente y los recursos se pueden escalar de manera elástica. demanda.

Elemento 3: Despliegue mixto de recursos

En la producción diaria, para garantizar una alta calidad de servicio, las aplicaciones de servicios en línea a menudo se ejecutan durante mucho tiempo y monopolizan los recursos de la CPU, pero la tasa de utilización de la CPU es muy baja; mientras que las tareas informáticas fuera de línea son todo lo contrario, generalmente con un corto ciclo de vida e impacto en la calidad del servicio de recursos Los requisitos no son altos, pero la utilización de la CPU es alta durante el tiempo de ejecución. Con la expansión de la escala comercial, los grupos de recursos de los clústeres de negocios en línea y los clústeres fuera de línea aumentan gradualmente. Debido al bajo período pico de negocios, habrá problemas con la utilización de recursos. Un fenómeno obvio es que la tasa de asignación de recursos de los clústeres es alto, pero el real La tasa de utilización es baja.

Las instituciones financieras implementan clústeres en línea y fuera de línea en el proceso de construcción de la arquitectura nativa de la nube. Además de las capacidades básicas, como el uso compartido elástico de la CPU y la preferencia de prioridad, la programación escalonada de aplicaciones fuera de línea/en línea, la clasificación de QoS de la aplicación y la gestión jerárquica de la memoria, el aislamiento de recursos. En y ajuste dinámico, los servicios en línea de diferentes tipos de atributos y los servicios informáticos fuera de línea se combinan con precisión para resolver el problema de la utilización eficiente de los recursos. En correspondencia con la complejidad del nivel financiero, es necesario establecer los siguientes estándares de capacidad de departamentos mixtos:

Departamento mixto a gran escala y con múltiples escenarios, incorporar tecnología de departamento mixto en la infraestructura y el entorno para la operación comercial, mejorar el rendimiento de las capacidades técnicas del departamento mixto y facilitar la promoción a otros entornos de recursos;

Supere la consistencia de los sistemas de gestión y control y operación y mantenimiento de departamentos mixtos. Unificar el proceso de acceso a los recursos para garantizar el mantenimiento y la gestión de la coherencia global del software básico y la configuración;

Procesos flexibles, eficientes y detallados para la programación de recursos, cambio rápido de recursos para servicios en línea y fuera de línea y programación integrada de recursos;

La estabilidad de las piezas mixtas alcanza el índice de estabilidad del mismo nivel que el de las piezas no mixtas. Confíe en la formulación de medición de servicios de grano fino, así como en la mejora del aislamiento de recursos y la adaptabilidad de las operaciones comerciales;

Sistema de monitoreo mixto para mejorar el monitoreo del tiempo de ejecución, el descubrimiento anormal y las capacidades de diagnóstico;

El mecanismo de respuesta a emergencias anormales del departamento mixto identifica escenarios por adelantado para los riesgos de estabilidad y formula un mecanismo de respuesta a emergencias basado en procesos para crear capacidades de recuperación rápidas y anormales.

Elemento 4: Integración heterogénea de múltiples pilas de tecnología

Una red de servicios se puede considerar como una capa de infraestructura que maneja la comunicación entre servicios. Las aplicaciones nativas de la nube modernas tienen topologías de servicios complejas, y las mallas de servicios son responsables de la entrega confiable de solicitudes a través de estas topologías. En la práctica, un grid de servicios suele ser un conjunto de agentes de red ligeros que se despliegan junto con las aplicaciones, se puede comparar con TCP/IP entre aplicaciones o microservicios, responsables de las llamadas de red entre servicios, limitación de corriente, fusión y monitorización.

Antes de la aplicación de la tecnología de red de servicios, la implementación del sistema de microservicios suele estar a cargo del equipo de software intermedio para aplicaciones comerciales. Un SDK integrará varias capacidades de gobernanza de servicios en el SDK, como descubrimiento de servicios, equilibrio de carga, ruptura de circuitos y limitación de corriente y enrutamiento del servicio. En tiempo de ejecución, el SDK y el código de la aplicación comercial se mezclan y ejecutan en un solo proceso, y el grado de acoplamiento es muy alto, lo que genera una serie de problemas:

Un costo de actualización es alto. Cada vez que se actualiza el SDK, la aplicación comercial debe modificar el número de versión del SDK y luego volver a publicar la aplicación. Cuando el negocio se desarrolla rápidamente, dichas actualizaciones afectarán la eficiencia de la investigación y el desarrollo.

En segundo lugar, la fragmentación de versiones es grave. Debido al alto costo de las actualizaciones de SDK y el desarrollo continuo de middleware, con el tiempo, generará problemas como versiones de SDK inconsistentes y capacidades desiguales, lo que generará una gran carga de trabajo para la administración unificada.

En tercer lugar, la evolución del middleware es difícil. Debido a la grave fragmentación de la versión SDK, cuando el middleware evoluciona, debe ser compatible con varias lógicas de versiones anteriores en el código. Es como caminar con grilletes y no puede lograr una iteración rápida.

La red de servicios de las instituciones financieras incorpora algunas capacidades de comunicación de red originalmente integradas a través del SDK en Sidecar, incluidas las capacidades básicas de RPC, mensajes y acceso a la base de datos, así como el descubrimiento de servicios, la fusión, la limitación de corriente, el control del tráfico, la capacidad de crear subbases de datos. y la subtabla de la base de datos aporta una infraestructura de comunicación más transparente al sistema empresarial, desvincula la evolución iterativa de la infraestructura del sistema empresarial, permite que la investigación y el desarrollo empresariales se centren en la lógica empresarial, reduce la carga sobre el sistema empresarial y mejora la eficiencia iterativa del negocio de los sistemas y la infraestructura.

Elemento 5: Continuidad de la infraestructura (integración de lo público y lo privado)

Cuando más y más sistemas centrales también se están moviendo hacia la nativaización completa de la nube , la programación y orquestación de recursos a gran escala se ha convertido en una capacidad indispensable para la continuidad de la infraestructura financiera. Cómo proporcionar servicios para miles de aplicaciones en diferentes departamentos comerciales de instituciones financieras, cómo hacer que diferentes aplicaciones utilicen bien la nube, satisfacer las diferencias en las demandas de recursos de diferentes aplicaciones y aprovechar al máximo la capacidad de la nube para respaldar el crecimiento empresarial, La continuidad de la infraestructura debe ser Capacidades de administración de recursos unificados como la nube pública, que no solo incluyen escenarios tradicionales de transacciones y datos, sino que también incluyen la adopción cada vez mayor de nuevo hardware informático heterogéneo representado por GPU en la informática a gran escala. las tareas de capacitación de aprendizaje, las tareas de razonamiento en línea, las tareas de codificación y decodificación de transmisión de medios, etc., requieren escenarios informáticos de recursos más ricos.

La continuidad de la infraestructura unificada para el funcionamiento y la gestión unificados de los recursos subyacentes puede optimizar los costos y mejorar la eficiencia a través de medios técnicos ricos nativos de la nube desde múltiples dimensiones, como la cadena de suministro, la previsión de la capacidad, la planificación de la capacidad y la elasticidad del grupo de recursos. control, cero fugas de recursos subyacentes y soporte para todos los escenarios de una manera plana, fácil de administrar, flexible, configurable y flexible.

Elemento 6: Prevención y control de riesgos de tecnología full-link

Muchas fallas de producción del sistema comercial financiero son causadas por cambios, y el control de cambios es crucial para la prevención y el control de riesgos técnicos. Especialmente bajo la arquitectura distribuida de microservicios, la escala del servicio es enorme y la fuente de cambio es extensa.Si el cambio no tiene fuertes capacidades de control y seguimiento, una vez que ocurre un problema en línea, es difícil encontrar rápidamente el cambio correspondiente en el primero. lugar confiando en el seguimiento manual. También es difícil controlar de manera efectiva la calidad del cambio en sí mismo, lo que requiere un "sistema de control y prevención de riesgos técnicos" basado en la arquitectura nativa de la nube para administrar y controlar los riesgos y cambios en todo el enlace. .

El principio rector central de la prevención y el control de riesgos técnicos son los "tres trucos del cambio": observable, en escala de grises y de emergencia. Cualquier cambio requiere que se implementen capacidades observables antes de la implementación para evaluar los efectos esperados, identificar problemas inesperados y guiar una mayor expansión del alcance de los cambios y la toma de decisiones sobre las acciones de respuesta a emergencias. "Escala de grises" enfatiza que los cambios deben expandir gradualmente el alcance y diseñar el proceso en escala de grises desde múltiples dimensiones, como la región, el centro de datos, el entorno, el servidor, el usuario y el tiempo. "Emergencia" enfatiza que el plan de cambios debe dar prioridad a garantizar la capacidad de reversión. Debido a circunstancias especiales, es posible que algunos cambios no tengan la capacidad de reversión o que el costo de la reversión sea inaceptable. Esto debe manejarse agregando otros cambios, como datos corrección. , nueva versión en línea, etc. Los "tres ejes de cambio" también son las capacidades centrales del control de riesgos de cambio bajo la arquitectura nativa de la nube financiera. La integración de capacidades, la creación de algunas capacidades de fusión y autocuración durante el proceso de cambio.

La responsabilidad central del "sistema de control y prevención de riesgos de enlace completo" es hacer que los cambios sean visibles y más rastreables mediante la integración de toda la información de cambio. Al mismo tiempo, proporciona capacidades tales como organización de cambios, inspección de cambios en escala de grises, verificación previa de cambios y monitoreo de resultados de cambios y alerta temprana.Cuando ocurre un problema, proporciona asociación de cambios para acelerar el procesamiento de problemas en línea.

Además, el sistema de prevención y control de riesgos de enlace completo también debe ser capaz de producir análisis de puntos de riesgo de pérdida de capital, formular medidas de prevención y control y aclarar los detalles del plan; en la etapa de prueba y análisis de calidad, prueba y debe llevarse a cabo un análisis de verificación de capital. Antes del lanzamiento, es necesario evaluar nuevamente el riesgo para verificar si se han implementado las medidas de prevención y control de pérdidas de capital, incluida la verificación en tiempo real, T + M verificación a nivel de minutos, T + H verificación a nivel de horas, T + 1 verificación al día siguiente, etc. "Suscríbase para verificar la alerta temprana y, al mismo tiempo, el lado comercial debe realizar una aceptación completa del flujo de capital. Las operaciones de flujo de fondos se realizan a través de modos de verificación como certificados, certificados, cuentas y cuentas.

Elemento 7: Credibilidad y seguridad nativa de la nube

En la actualidad, las amenazas externas en el entorno de Internet tienden a ser diversificadas y nuevas. Los métodos de defensa tradicionales tienen una buena respuesta a las explotaciones de vulnerabilidades conocidas y los métodos de ataque de amenazas, pero no pueden lidiar bien con los ataques APT, los ataques de vulnerabilidad 0Day, etc. Nuevo tipo de amenaza . Sin embargo, estas amenazas conocidas y nuevas comparten una característica común: todas son comportamientos que la empresa no espera. En función de esta característica, la tecnología nativa de la nube debe realizar una medición creíble de todas las solicitudes de servicio y comportamientos de carga de recursos, y establecer un sistema de defensa de seguridad en profundidad basado en comportamientos creíbles para garantizar que solo se pueda acceder y ejecutar con éxito los comportamientos esperados. Bloquee e intercepte para lograr el efecto de resistir amenazas conocidas y desconocidas.

Al mismo tiempo, para garantizar el aislamiento de seguridad entre las entidades comerciales en la industria financiera, los servicios técnicos como la infraestructura también deben crear un entorno aislado de las entidades comerciales, con un entorno de red aislado e independiente y un mayor nivel de seguridad. Los servicios de tecnología de plataforma nativa de la nube se actualizan a servicios nativos confiables a través de transformaciones relevantes, como el aislamiento de múltiples inquilinos, la administración y el control unificados, y la convergencia de canales confiables de acuerdo con los estándares de servicios nativos confiables. Para el entorno en el que se ejecuta la aplicación, la arquitectura segura y confiable nativa de la nube tiene seguridad integrada y capacidades confiables como identidad, autenticación, autorización, control de acceso de enlace completo y cifrado de enlace completo en la infraestructura, y realiza infraestructura y seguridad tanto como sea posible. El desacoplamiento de aplicaciones reduce las interrupciones a los servicios de una manera confiable y nativa, y proporciona un entorno operativo de aplicaciones confiable.

Elemento 8: Coherencia a nivel financiero

imagen.png

imagen.png

Las aplicaciones nativas de la nube son principalmente sistemas distribuidos, y las aplicaciones se dividirán en múltiples sistemas de microservicios distribuidos. La división generalmente se divide en división horizontal y división vertical. Esto no solo se refiere a bases de datos o cachés. La división expresa principalmente una división y conquistar la idea y la lógica.

La capa inferior de un sistema distribuido no puede escapar del "triángulo imposible de CAP" (C: Consistencia, consistencia; A: Disponibilidad, disponibilidad; P: Tolerancia de partición, tolerancia de partición). El principio CAP demuestra que cualquier sistema distribuido solo puede satisfacer los dos puntos anteriores al mismo tiempo y no puede ocuparse de los tres. Sin embargo, los sistemas de servicios distribuidos deben cumplir con la tolerancia de partición, por lo que se debe hacer un equilibrio entre consistencia y disponibilidad. Si ocurre una situación anormal en la red, la demora de la red entre algunos nodos en el sistema distribuido seguirá aumentando, lo que puede causar una partición de la red en el sistema distribuido. La operación de copia puede retrasarse, si nuestro usuario espera a que se complete la copia antes de regresar, puede resultar en que no pueda regresar dentro de un tiempo limitado y pierda disponibilidad, y si el usuario no espera a que se complete la copia, pero en el fragmento principal que regresa directamente después de escribir tiene facilidad de uso, pero pierde consistencia.

Para las instituciones financieras, la alta disponibilidad a nivel de arquitectura y la sólida consistencia a nivel empresarial son casi igualmente importantes. Esto requiere una nube nativa de nivel financiero para poder equilibrar bien el "triángulo imposible de CAP", y es necesario tener en cuenta la coherencia comercial sólida y la alta disponibilidad del sistema tanto como sea posible.

Pero el "desafío de coherencia" no es solo un problema de base de datos en un sistema distribuido, sino un gran tema que abarca todos los niveles de un sistema distribuido: coherencia de transacciones, coherencia de nodos, coherencia empresarial entre sistemas, potencia de mensajes Igualdad de coherencia, coherencia de caché, coherencia IDC, etc. Por lo tanto, también es necesario que la arquitectura nativa de la nube cuente con una serie de tecnologías que puedan hacer frente a los estrictos desafíos de la consistencia a nivel financiero.

Nivel de transacción: es necesario seleccionar un modelo de transacción distribuida apropiado de acuerdo con diferentes escenarios financieros.Después de equilibrar el costo y el rendimiento, SAGA y TCC son dos modelos de transacción distribuida comúnmente utilizados por las instituciones financieras. El modo SAGA es menos intrusivo para la implementación de la aplicación, pero se basa en la transacción de compensación para garantizar la consistencia del diseño, y el aislamiento de la transacción no está garantizado durante la ejecución de los pasos anteriores y posteriores; mientras que el modo TCC puede lograr mejor aislamiento de transacciones, pero requiere una conciencia de capa de aplicación más compleja. Para algunos nodos en el proceso de transacción que no necesitan devolver resultados sincrónicamente, se puede usar una cola de mensajes asíncrona para mejorar la eficiencia de ejecución.Para algunos escenarios con procesos de transacción largos, puede reducir significativamente la complejidad de la implementación de transacciones y reducir los picos y llenar valles. Los escenarios típicos, como la compra de gestión patrimonial por parte del cliente, se simplifican en dos pasos: deducción de la cuenta de depósito y crédito de la cuenta de gestión patrimonial. En el estado anormal de "a", el sistema necesita revertir la deducción de la cuenta de depósito para garantizar la consistencia de la transacción. Si se selecciona el modo TCC, el procesamiento lógico de la deducción de la cuenta de depósito y la entrada de la cuenta de gestión patrimonial se completan sucesivamente, y el sistema de depósito y el sistema de gestión patrimonial deben registrar el estado del procesamiento lógico respectivamente. es iniciado.

Nivel de base de datos: en el escenario financiero, existe un requisito extremo para que los datos no se pierdan, por un lado, se deben guardar varias copias en varias salas de computadoras en la misma ciudad o en diferentes lugares, el RPO externo está cerca a cero. El algoritmo Paxos es un algoritmo para lograr la consistencia de datos en un sistema distribuido basado en el paso de mensajes. Garantía central de consistencia de datos.

Nivel de sala de computadoras: capacidades de enrutamiento entre salas de computadoras y capacidades de recuperación entre salas de computadoras para transacciones anormales. Cuando ocurre una falla en la sala de computadoras, la base de datos debe poder cambiar a la misma copia de ciudad/fuera del sitio, y asegurarse de que el RPO sea cero, y cooperar con el cambio de enrutamiento de transacciones en la capa de aplicación para completar la computadora. interruptor de recuperación ante desastres a nivel de sala y restauración del negocio. Durante la interrupción de parte del proceso de transacción debido a la falla de la sala de computadoras, el componente de transacción distribuida debe tener la capacidad de recuperarse automáticamente y reiniciar el proceso de transacción interrumpido para completar hacia adelante o hacia atrás de acuerdo con las reglas comerciales preestablecidas. .

Elemento 9: Unitarización, múltiples ubicaciones y múltiples actividades

imagen.png

Con el rápido desarrollo de los servicios financieros digitales, el entorno de producción centralizado tradicional ha sido difícil de satisfacer la demanda. La dirección de evolución actual es la estructura unificada de "multiactivos en diferentes lugares", basada en la sala de computadoras unificada (en adelante, LDC) para cumplir con los requisitos de seguridad de alta puntualidad y nivel financiero.

La arquitectura de "tres centros en dos lugares" generalmente adoptada por las instituciones financieras tiene varias deficiencias típicas. Primero, esta arquitectura requiere que dos centros en la misma ciudad tengan una capacidad de sala de computadoras similar para cumplir con el cambio completo. Segundo, bajo este modelo de arquitectura, desastre remoto Los sistemas de recuperación suelen ser "fríos". En realidad, no transportan tráfico comercial y es difícil hacerse cargo de todo el negocio cuando ocurre un desastre. Dado que los nuevos centros de datos generalmente se concentran en áreas alejadas de los centros de datos tradicionales, como Mongolia Interior y Guizhou, y la relación de capacidad de los centros de datos nuevos y antiguos está muy desequilibrada, las instituciones financieras deben superar los "tres centros en dos". lugares" en términos de estructura operativa. El modelo tradicional evoluciona a una solución de recuperación ante desastres "multiactiva" N+1 para mejorar aún más las capacidades sistémicas de recuperación ante fallas.

"Arquitectura multiactiva remota" se refiere a la capacidad de expansión basada en la arquitectura de la unidad LDC. Las unidades LDC se implementan en IDC en diferentes regiones, y cada unidad LDC está "en vivo", lo que realmente lleva a cabo el tráfico comercial real en la línea. En caso de fallo, es posible cambiar rápidamente entre unidades LDC. La arquitectura de la unidad multiactiva remota resuelve los siguientes cuatro problemas clave:

La implementación fuera del sitio es posible gracias a la minimización de las interacciones entre unidades y el uso de la asincronía. La escalabilidad horizontal de todo el sistema se mejora considerablemente, ya que ya no depende del mismo IDC de la ciudad;

Puede realizar la estrategia de recuperación de desastres remota N+1, reduciendo en gran medida el costo de la recuperación de desastres y, al mismo tiempo, asegurando que las instalaciones de recuperación de desastres estén realmente disponibles;

No hay un solo punto en todo el sistema, lo que mejora en gran medida la alta disponibilidad general; varias unidades implementadas en la misma ciudad y en diferentes lugares se pueden usar como instalaciones de recuperación ante desastres para respaldo mutuo, y se pueden cambiar rápidamente a través de la operación y el mantenimiento plataforma de gestión y control, que tiene la oportunidad de alcanzar el 100% de disponibilidad continua;

Bajo esta arquitectura, la entrada y salida del tráfico en el nivel de servicio forman un punto de control controlable y enrutable unificado, y la capacidad de control del sistema general mejora considerablemente. Con base en esta arquitectura, los modos de gestión y control de operación y mantenimiento que antes eran difíciles de implementar, como la medición de presión en línea, el control de tráfico y la liberación de escala de grises, ahora se pueden implementar muy fácilmente.

Elemento 10: Continuidad del negocio y operación y mantenimiento de inteligencia digital

imagen

En un entorno nativo de la nube, es necesario correlacionar la información en varios contenedores, varias máquinas virtuales, varios hosts, varias zonas de disponibilidad e incluso varias regiones para responder por qué el servicio está inactivo y por qué no se implementa el SLO definido. los usuarios y las empresas se ven afectados por la falla, etc., pueden realizar una gestión de mantenimiento y operación inteligente digital eficiente basada en datos de operación y mantenimiento e inteligencia de inteligencia artificial.

La operación y el mantenimiento inteligente digital nativo de la nube incluye principalmente siete aspectos de capacidades:

Capacidades de monitoreo y descubrimiento: observabilidad omnidireccional de indicadores, registros y enlaces, cobertura integral de servicios, middleware e infraestructura, y capacidades de desglose.

Capacidad de respuesta ante emergencias por fallas: Capacidades de recuperación, ubicación rápida y detección integral anormal, lo que garantiza el SLA comercial.

Capacidades de control y prevención de riesgos de cambio: gestión y control de cambios comerciales completos, adhiriéndose estrictamente a los tres ejes de "puede ser en escala de grises, observable y revertir".

Capacidad de gestión de capacidad: desde el negocio hasta la infraestructura, proporciona una evaluación precisa de la capacidad de enlace completo y la identificación temprana de riesgos para lograr un equilibrio entre la estabilidad y el costo.

Capacidad de gestión de recuperación ante desastres: se puede organizar la recuperación ante desastres basada en la plataforma, que admita la recuperación ante desastres de la sala de computadoras, la recuperación ante desastres unificada y otros escenarios, simulacros de cobertura, conmutación y capacidades de pantalla grande.

Capacidad de simulacro y evaluación: a través de ingeniería del caos, ataque y defensa rojo y azul, etc., se detecta y prueba la capacidad de aseguramiento de riesgos comerciales.

Capacidad de garantía de seguridad de capital: en función de las reglas de verificación de seguridad de capital, el flujo de capital del sistema empresarial se supervisa a través de métodos fuera de línea, en tiempo real, de archivos y otros.

La operación y el mantenimiento inteligente digital nativo de la nube tiene principalmente tres características:

Eficiente: Mejore la eficiencia de la operación y el mantenimiento a través de la plataforma del trabajo de operación y mantenimiento. Como la plataforma de monitoreo del sistema, la plataforma de control y gestión de cambios, la plataforma de control y gestión de recursos dinámicos, el centro de programación, el centro de registro, etc.

Seguridad: Basado en la plataforma de verificación automática de negocios y las reglas de operación de big data, se garantiza la estabilidad y corrección de la operación del sistema. Como el centro de verificación de datos, la plataforma de gestión y control de dependencias, la plataforma de gestión y control de detección de capacidad, etc.

Inteligencia: Gestión y control inteligente de la operación y mantenimiento basado en análisis de big data y cálculo de reglas. Como el sistema automático de análisis y procesamiento de fallas, el sistema automático de detección y expansión de capacidad, etc.

Cree un nuevo modelo para la nube financiera nativa

Arquitectura de aplicaciones nativas de la nube de calidad financiera 

El libro "La arquitectura es el futuro" presenta catorce principios básicos del diseño de aplicaciones distribuidas, que son los elementos centrales de la arquitectura de aplicaciones nativas de la nube más importante.

Diseño N+1 : asegúrese de que cualquier sistema que desarrolle tenga al menos una instancia redundante en caso de falla. Diseño de reversión : asegúrese de que el sistema se pueda revertir a cualquier versión anterior.

Switch Disable Design : Capacidad para desactivar cualquier funcionalidad publicada. Diseño de monitoreo : El monitoreo debe ser considerado durante la fase de diseño, no agregado después de que se complete la implementación.

Diseñe un centro de datos multiactivo : considere la implementación multiactiva al diseñar y no se limite a una solución de centro de datos.

Diseño asincrónico : asincrónico es adecuado para la concurrencia, solo realice llamadas sincrónicas cuando sea absolutamente necesario.

Sistema sin estado : un sistema sin estado es más propicio para la expansión y el equilibrio de carga. Use el estado solo cuando el negocio realmente lo requiera.

Escalamiento horizontal, no actualizaciones verticales : nunca dependa de sistemas más grandes y rápidos. La idea central de los microservicios es expandirse horizontalmente, no concentrar todas las funciones en un solo sistema. Cuando sea necesario, divida los requisitos en varios sistemas en lugar de actualizar el sistema original.

Diseño prospectivo : considere de antemano las soluciones que afectan los problemas de escalabilidad del sistema de la próxima etapa y perfeccione continuamente los servicios compartidos públicos para reducir la cantidad de refactorizaciones.

Comprar si no es core : Si no es lo que mejor se te da y no te proporciona una ventaja competitiva diferenciada, entonces cómpralo directamente. Se pueden comprar bases de datos, servicios en la nube, etc.

Pequeñas compilaciones, pequeños lanzamientos, prueba y error rápidos : toda la I + D requiere pequeñas compilaciones y una iteración continua para permitir que el sistema crezca continuamente. Las versiones pequeñas tienen una tasa de fallas más baja porque la tasa de fallas está directamente relacionada con la cantidad de cambios en la solución.

Aislar fallas : realice el diseño de fallas aisladas y evite la propagación de fallas y los efectos cruzados a través de la protección de circuito abierto. Es muy importante evitar la influencia mutua entre múltiples sistemas.

Automatización : "La automatización es la fuente de la sabiduría". En la arquitectura nativa de la nube, la implementación rápida y la administración automatizada son el núcleo. El diseño comienza con el proceso de automatización tanto como sea posible a través de la arquitectura y el diseño. No dependas de los humanos si las máquinas pueden hacerlo.

Usar tecnología comprobada : Si una tecnología tiene una alta tasa de fallas, nunca se debe usar.

Arquitectura de plataforma nativa en la nube de calidad financiera

La arquitectura general de la plataforma nativa de la nube financiera se puede dividir en cinco dominios principales: dominio de diseño, dominio de investigación y desarrollo, dominio de operación, dominio de operación y mantenimiento y dominio de recuperación ante desastres.

Modo de diseño: adopte el diseño basado en dominios y otros métodos de diseño que sean naturalmente compatibles con el sistema de arquitectura de microservicios, y preste atención a cuestiones como la consistencia de los datos y la granularidad del servicio durante el proceso de diseño, e implemente los principios y especificaciones de diseño del diseño de arquitectura distribuida. .

Estado de I + D: para el personal de I + D, proporcione herramientas de productividad de I + D integrales, proteja la complejidad de la tecnología distribuida y mejore la experiencia y la productividad del personal de I + D. Alcance una plantilla de ingeniería de amplio consenso para reducir los costos cognitivos de la organización.

Estado de ejecución: infraestructura orientada a aplicaciones para la operación de aplicaciones distribuidas, que cubre todo el ciclo de vida de las aplicaciones, incluida la creación, implementación, monitoreo y cambios de configuración, que admite varias formas de interacción de aplicaciones y almacenamiento de datos. La capa inferior admite varias formas de métodos informáticos y métodos de programación en ellos.

Estado de operación y mantenimiento: para el personal de operación y mantenimiento, resuelve la complejidad inherente de la arquitectura distribuida y utiliza ampliamente métodos de ingeniería para garantizar la disponibilidad general del sistema.

Estado de recuperación ante desastres: orientado a desastres, brinda la capacidad de tolerar desastres a nivel de nodo, nivel de sala de cómputo y nivel de ciudad.

imagen.png

Arquitectura de datos nativa de la nube de calidad financiera 

El marco nativo de la nube tiene ventajas inherentes, como entrega rápida, escalabilidad elástica, estandarización, automatización y aislamiento. Se integra continuamente con la nueva generación de tecnología de datos para formar un sistema de arquitectura de datos nativo de la nube con las siguientes características.

1. Fusión escalable de múltiples modos informáticos

La arquitectura de datos nativos de la nube puede admitir de manera uniforme la integración de diferentes modos informáticos, como lote, flujo, interactivo, multimodo y gráfico, tales como: integración de lago y almacén, integración de flujo y lote, y flujo de aprendizaje automático, permitiendo una integración profunda de varios sistemas informáticos. Funciones y ecología complementarias, los usuarios pueden completar más tipos de cálculos en un solo sistema, mejorar la eficiencia operativa de la plataforma y reducir los costos de uso.

2. Capa de almacenamiento distribuido inteligente multicapa

La separación del almacenamiento y la informática se convertirá en el estándar dentro de dos o tres años, y la plataforma de datos se desarrollará en la dirección del alojamiento y la nube nativa. La organización refinada en niveles dentro del almacenamiento se ha convertido en un medio clave para equilibrar el rendimiento y el costo. Con base en la combinación de almacenamiento de múltiples niveles (almacenamiento en caliente/almacenamiento estándar/almacenamiento en frío, etc.) en un sistema de almacenamiento distribuido y la utilización del almacenamiento, los costos de almacenamiento pueden reducirse. reducido. La IA desempeñará un papel más importante en los algoritmos en capas. En el caso de un espacio de optimización limitado para la codificación y la compresión en los procesadores de uso general, los avances futuros y las actualizaciones tecnológicas dependerán del desarrollo técnico y la aplicación de la integración de software y hardware. .

3. Programación unificada y administración de grupos de recursos de escalabilidad elástica

A medida que continúa profundizándose la separación del almacenamiento y la informática del lago de datos, el establecimiento de un sistema unificado de programación de recursos en contenedores basado en una arquitectura nativa de la nube se ha convertido en un componente necesario para el desarrollo del almacenamiento del lago de datos y la separación informática, proporcionando una agrupación de recursos unificados y fuera de línea. almacenamiento para la arquitectura integrada de big data e IA. El soporte básico del departamento mixto; realice la planificación y programación general de recursos a través del grupo de recursos de potencia informática unificada, optimice la gestión y programación de recursos granulares, y puede combinar fuera de línea computación y otras tareas informáticas en línea para lograr el efecto de complementariedad pico y valle, lo que ayuda a mejorar la utilización de los recursos del servidor; al mismo tiempo, los recursos de tareas informáticas también se pueden asignar de acuerdo con las prioridades comerciales para garantizar que no haya conflictos durante la programación de recursos , de modo que durante los períodos comerciales pico, los recursos de potencia informática se pueden llamar en un modo de expansión y contracción elástica para aprovechar al máximo la potencia informática de los recursos. Mejorar la eficiencia de la respuesta.

4. Capacidades inteligentes de operación y mantenimiento de big data SRE

La diversidad de las tecnologías de big data y la complejidad de la arquitectura de la plataforma de datos plantean desafíos para la operación y el mantenimiento de las plataformas de big data. La plataforma de big data de nueva generación puede admitir actualizaciones continuas en línea para acortar el tiempo de actualización; proporcionar una operación unificada de varios procesos de carga de trabajo heterogéneos, una gestión unificada de los ciclos de vida del trabajo, una programación unificada de los flujos de trabajo de tareas y garantizar la escala y el rendimiento de las tareas; a través de registros de trabajo, indicadores de rendimiento, utilización de recursos y otros datos, combinados con registros históricos y condiciones de carga en tiempo real, utilice métodos de aprendizaje automático para analizar, detectar y optimizar, en la planificación de consultas, el modelo de datos, la autoadaptación de la gestión de recursos y la anomalía del sistema detección y autorreparación, etc. En términos de optimización continua, forma las capacidades inteligentes de operación y mantenimiento de plataformas de datos a gran escala.

Infraestructura nativa de la nube de grado financiero 

La infraestructura nativa de la nube de grado financiero debe cumplir cinco requisitos generales y 13 requisitos de gestión.

(1) Los cinco requisitos generales son:

Una es adoptar productos maduros de plataforma en la nube para crear una plataforma de computación en la nube integrada de IaaS y PaaS, realizar un catálogo de servicios completo en el lado del arrendatario y en el lado de la operación y el mantenimiento, y conectarse sin problemas con el sistema de desarrollo de software y la operación y el mantenimiento de la producción. sistema;

El segundo es realizar el suministro flexible de recursos básicos en toda la empresa y respaldar el sistema comercial de toda la empresa para realizar una arquitectura de recuperación ante desastres de alta disponibilidad de acuerdo con el marco de tecnología distribuida para cumplir con los requisitos de producción segura;

El tercero es cumplir plenamente con los requisitos de innovación de las aplicaciones de tecnología de la información. Desde la base de la plataforma en la nube hasta los servicios de software, tiene la capacidad de innovar y ejecutar aplicaciones de tecnología de la información de enlace completo, al tiempo que garantiza el funcionamiento estable y de alto rendimiento de las aplicaciones distribuidas. ;

Cuarto, tiene la base para proporcionar aplicaciones a gran escala a la nube, proporciona un marco de aplicación completo y proporciona soporte estable, continuo y de alto rendimiento para el sistema de aplicaciones;

En quinto lugar, los productos de la plataforma en la nube tienen un ecosistema maduro, que básicamente sigue el ritmo del desarrollo de la tecnología de nube pública en la industria y se adapta a la evolución de la última tecnología de código abierto.

(2) Los 13 requisitos de capacidad de gestión son:

Gestión de recursos unificados: use tipos de recursos físicos y arquitectura unificados para realizar una gestión unificada de los recursos básicos de hardware, como servidores, conmutadores, sistemas operativos, etc.; la plataforma de gestión en la nube realiza la informática en tres centros en dos lugares a través de métodos de gestión unificados (consola, API, etc.), el almacenamiento, la red y otros recursos de la nube se administran para reducir la complejidad del desarrollo, la operación y el mantenimiento.

Gestión de datos unificados: para estructuras activas-activas y multiactivas remotas dentro de la ciudad, la coherencia de los datos de los nodos de nube distribuidos está garantizada mediante el almacenamiento de datos, la migración, la sincronización, etc., y se proporcionan capacidades integradas de conmutación de enlace y recuperación ante desastres para cumplir con requisitos de continuidad en la mayor medida posible. Por ejemplo, proporciona una solución de duplicación unificada, recuperación ante desastres de almacenamiento de objetos, copia de seguridad y sincronización entre regiones de la base de datos, etc.

Gestión de servicios unificados: admita tres nodos centrales en dos lugares para gestionar servicios en la nube a través de API, SDK, consola, etc. unificados, como un plano de control unificado para la implementación y actualización de servicios, lo que reduce en gran medida la complejidad de la gestión de servicios en la nube y mejora la eficiencia. de uso de la nube.

Gestión unificada de operación y mantenimiento: a través de la gestión en la nube, el mismo sistema de operación y mantenimiento se puede usar para administrar diferentes nodos en tres centros en dos lugares, brindando una operación, monitoreo, confiabilidad SLA y otros servicios consistentes, reduciendo la carga de trabajo de los gerentes de operación y mantenimiento. y mejorar la eficiencia de operación y mantenimiento, reduciendo en gran medida las fallas del sistema y acortando el tiempo de inactividad.

Gestión de seguridad unificada: por un lado, la seguridad del lado de la plataforma se realiza a través de la infraestructura física, la seguridad de la red, el aislamiento del plano de datos/plano de control, etc.; por otro lado, los servicios de seguridad se realizan a través de la seguridad del host, el control de acceso, el cortafuegos, conciencia situacional, etc. para garantizar la seguridad integrada.

Programación unificada de recursos: a través de la gestión de la nube, se realiza la programación unificada de los recursos de potencia informática de los tres centros en dos lugares y se admiten varias estrategias de programación. La programación basada en la ubicación se combina con los servicios sensibles al retraso y al ancho de banda (como las aplicaciones de audio y video de la banca móvil); la programación basada en la informática se combina con la IA, los macrodatos y otros servicios informáticos a gran escala (como la programación de mareas, departamentos mixtos y otros escenarios) La programación basada en la carga de trabajo satisface escenarios heterogéneos y multidimensionales (como compras de pánico financiero, intercambio de puntos, Double 11 y otros escenarios de aplicación).

Administración de monitoreo unificado: complete el acceso y la visualización unificada de varios tipos de indicadores de monitoreo en la nube y fuera de la nube; complete la capacidad de seguimiento de enlaces distribuidos en la nube y fuera de la nube, y realice el monitoreo capa por capa desde el monitoreo comercial, monitoreo de servicios de aplicaciones y monitoreo de recursos Análisis detallado y multidimensional para mejorar la ubicación de fallas y las capacidades de análisis; a través del acoplamiento y la optimización del centro de alarma unificado para completar umbrales dinámicos, mejorar las capacidades generales de percepción de eventos comerciales, capacidades de posicionamiento rápido y capacidades inteligentes de análisis y toma de decisiones.

Admite múltiples potencias informáticas: el grupo de recursos de la nube es compatible con múltiples potencias informáticas, como CPU y GPU, y proporciona servicios eficientes de potencia informática en la nube para nuevos productos de aplicaciones de tecnología financiera en escenarios de campos múltiples, como inteligencia artificial, aprendizaje profundo y computación científica. .

Apoye la innovación de aplicaciones de tecnología de la información de pila completa: a través de un sistema compatible con capacidades de servicio de múltiples productos, admita capacidades de servicio de plataforma de nube XC de pila completa y multinúcleo de una nube, y promueva la implementación de estrategias de innovación de aplicaciones de tecnología de la información.

Admite una gestión refinada: a través de las capacidades de medición y facturación de la plataforma y la conexión con varios sistemas de la industria, se realizan las capacidades de medición y facturación de la informática, el almacenamiento, la red, la seguridad y otros recursos. Realice gradualmente la gestión refinada de los costos de TI, realice la medición y evaluación de la inversión empresarial en TI y la producción empresarial, realice el equilibrio entre costo y eficiencia, y realice el uso eficiente de los recursos de TI.

Admita la gestión completa: cumpla con la automatización del proceso de entrega completa y el procesamiento por lotes desde el almacenamiento del servidor, la instalación automática, la configuración del sistema y la orquestación de software, mejore la eficiencia de la entrega y reduzca la carga de trabajo manual; cumpla con los requisitos de gestión unificada completa y realice una supervisión y gestión unificadas alarma metálica.

Apoyo a la calidad del servicio: a través de la mejora de las capacidades de autoservicio, la construcción de la plataforma de administración de infraestructura podrá proporcionar una operación eficiente y estable y una administración refinada para brindar mejores servicios. De acuerdo con la recopilación y el análisis de datos de la plataforma, mejorará efectivamente la dirección de gestión y el contenido, y puede mejorar efectivamente la calidad del servicio.

Desarrollo de arquitectura de soporte: adopte la arquitectura de nube patentada líder en la industria, construya una plataforma de nube con la misma fuente que la nube pública y cumpla con los requisitos de recuperación ante desastres de la industria financiera, admita todos los productos a través de un conjunto de sistemas y soporte el construcción de un sistema integrado de operación y mantenimiento en línea y fuera de línea para todo el banco, a través de un diseño de arquitectura orgánica y unificada, para cumplir con el desarrollo de capacidades de la futura plataforma de nube completa.

05 Ruta de implementación nativa de la nube a nivel financiero

Evaluación de la capacidad nativa de la nube a nivel financiero

“La mejor manera de invertir en el futuro es mejorar el presente”.

La nube nativa a nivel financiero ha liberado en gran medida los dividendos de la era digital. La nube nativa hereda completamente las ideas de diseño de la nube. En el futuro, se desarrollarán más aplicaciones basadas en la nube. Es decir, las aplicaciones nativas de la nube son más adecuado para la arquitectura de la nube, y la computación en la nube también es para las aplicaciones nativas de la nube brindan un mejor soporte básico, como el mecanismo de aislamiento de recursos, la implementación distribuida y la arquitectura de alta disponibilidad A través de nuevas arquitecturas y tecnologías, el sistema de aplicaciones se vuelve más robusto. Se puede decir que las aplicaciones nativas de la nube maximizan las ventajas de la nube.

Basado en la plataforma de nube integrada IaaS/PaaS, un banco utiliza un marco de microservicio distribuido, middleware de nube, contenedor, DevOps y otras tecnologías nativas de la nube para crear una plataforma de nube que puede proporcionar expansión horizontal, escalado de segundo nivel, operación inteligente y mantenimiento y adaptarse al desarrollo rápido y la entrega continua.La plataforma en la nube de nivel PaaS promueve la evolución del banco de la arquitectura tradicional a la arquitectura de Internet. La plataforma implementa, ejecuta y programa recursos basados ​​en contenedores, y utiliza las características livianas de los contenedores para ahorrar más recursos de implementación y operación de aplicaciones cuando aumenta la cantidad de servicios, y puede hacer frente fácilmente al tráfico comercial fluctuante. Al mismo tiempo, la forma de entrega de imágenes de la aplicación realiza "una compilación, múltiples implementaciones", evitando la complejidad operativa y los riesgos operativos que genera el proceso de implementación tradicional. A través de esta plataforma se ha acortado el ciclo de entrega de aplicaciones en un 80% y se ha incrementado en un 50% la velocidad de respuesta a las necesidades del negocio.

Sin embargo, cuando las instituciones financieras comenzaron a comprar y adoptar tecnologías nativas de la nube en grandes cantidades, surgieron muchos problemas, como que el sistema de productos de tecnología nativa de la nube era demasiado complejo, el ecosistema de código abierto carecía de gobernanza y la compatibilidad y adaptación entre productos eran difícil. Las características técnicas parciales a menudo causan una gran interferencia en la selección de instituciones financieras y generan altos costos de prueba y error.

“Abandonar el conjunto y mirar los detalles locales son hooligans”.

Cuanto más tecnología basada en plataformas, más necesita ser considerada desde una perspectiva general. Por lo tanto, existe una necesidad urgente de un conjunto de estándares unificados que combinen las características de la industria para proporcionar a las instituciones financieras un modelo de referencia de capacidad, de modo que las instituciones financieras puedan posicionarse en la etapa de desarrollo de la transformación de la tecnología nativa de la nube, comparar y analizar las deficiencias. del desarrollo de capacidades nativas de la nube y formular tecnologías y capacidades futuras. Combinamos algunas prácticas de la industria financiera para proporcionar a las instituciones financieras un marco completo de capacidad técnica y un modelo de evaluación de madurez de nueve dimensiones para adoptar tecnologías nativas de la nube, que se puede desarrollar con referencia a los siguientes indicadores:

Nivel de arquitectura de microservicio, nivel de nube de aplicaciones, observabilidad, gestión de alta disponibilidad, automatización de configuración, DevOps, capacidad de plataforma en la nube, seguridad nativa en la nube, capacidad de contenedor y K8.

imagen.png

Ruta de evolución nativa de la nube a nivel financiero 

Una buena arquitectura proviene de la evolución. Necesitamos un conjunto completo de planificación de la arquitectura para garantizar la integridad y las especificaciones de construcción, pero también necesitamos que la arquitectura continúe evolucionando para garantizar la estabilidad y el control generales. Por lo tanto, hemos resumido dos arquitecturas nativas de la nube La ruta de evolución se utiliza como referencia.

Ruta de referencia 1: observando la escala macro global (de arriba a abajo), busque deficiencias técnicas y rutas de evolución basadas en la evaluación de la capacidad nativa de la nube. El siguiente ejemplo es una ruta de evolución de tres etapas de la arquitectura nativa de la nube, que ayuda a las instituciones financieras a realizar gradualmente la transformación de la arquitectura de la aplicación de microservicios únicos a la unificación, y realizar la transición de doble activo en la misma ciudad a multiactivo en diferentes lugares. Busque la ruta de desarrollo de arquitectura más equilibrada para cumplir con el desarrollo empresarial y las pruebas de escenarios más exigentes.

imagen

Ruta de referencia 2: Partiendo del problema (de abajo hacia arriba), el propósito de la evolución de la arquitectura debe ser resolver un determinado tipo de problema. Es posible que desee comenzar desde la perspectiva de los "problemas" para diseñar la evolución de la arquitectura nativa de la nube en general. El siguiente ejemplo es una práctica de evolución continua de la arquitectura nativa de la nube mediante la resolución de problemas técnicos.

imagen

Paso 1: para que toda la arquitectura de la aplicación tenga un "mejor soporte subyacente", ejecute la arquitectura de la aplicación en la plataforma en la nube

Paso 2: para resolver el "problema de complejidad" de la arquitectura monolítica, utilice la arquitectura de microservicio

Paso 3: para resolver el "problema de excepción de comunicación" entre microservicios, use el marco de gobierno + monitoreo 

Paso 4: Para resolver el "problema de implementación" de una gran cantidad de aplicaciones bajo la arquitectura de microservicios, use contenedores

Paso 5: para resolver el "problema de orquestación y programación" de los contenedores, use Kubernetes

Paso 6: para resolver el "problema intrusivo" del marco de microservicio, use Service Mesh

06 Epílogo

Este artículo mapea y combina el concepto técnico nativo de la nube generalizado y los estándares técnicos de nivel financiero, y define el modelo y los diez elementos de la tecnología nativa de la nube de nivel financiero, con el objetivo de extender el concepto de tecnología nativa de la nube avanzada a tecnologías integrales. de organizaciones empresariales La pila propone una nueva arquitectura de referencia para la planificación de la arquitectura de la industria financiera para la innovación de aplicaciones de tecnología de la información Perseveremos en explorar y practicar juntos para acelerar la innovación de la arquitectura a nivel financiero.

Sobre el Autor:

Liu Weiguang, presidente de Alibaba Cloud Intelligent New Finance & Internet Industry, director ejecutivo de China Finance 40 Forum, se graduó del Departamento de Ingeniería Electrónica de la Universidad de Tsinghua. Antes de unirse a Alibaba Cloud, fue responsable de la promoción comercial y la construcción ecológica de la tecnología financiera y el desarrollo comercial de Ant Blockchain en Ant Financial; ha estado profundamente involucrado en el mercado de software empresarial durante muchos años, y una vez fundó Pivotal Software Greater China Branch, creando un nivel empresarial Es el primero en el mercado de big data y plataforma PaaS de computación en la nube de nivel empresarial. Antes de fundar Pivotal China Software Company, Liu Weiguang se desempeñó como gerente general de la División de Computación de Datos de EMC Greater China y trabajó para Oracle China durante muchos años. Una vez creó la División de Productos de Exadata Greater China y se desempeñó como director de la división.

{{o.nombre}}
{{m.nombre}}

Supongo que te gusta

Origin my.oschina.net/u/3874284/blog/8750844
Recomendado
Clasificación