Xu Haihong, experto técnico sénior de Computación elástica en la nube de Alibaba: Modelo de madurez de O&M de automatización en la nube

El 22 de marzo de 2023, se transmitió oficialmente la conferencia de prensa [Recientemente actualizado Alibaba Cloud ECS CloudOps 2.0] Libro blanco sobre operación y mantenimiento automatizados versión 2.0. Xu Haihong, experto técnico sénior de la computación elástica de Alibaba Cloud, compartió en esta transmisión en vivo un artículo titulado "Modelo de madurez de operación y mantenimiento automatizado en la nube”. Este artículo está compilado en base al contenido de su discurso.

Con la nueva actualización de la suite CloudOps (operación y mantenimiento automatizados en la nube), Alibaba Cloud ha lanzado una solución de producto inteligente compatible: evaluación e información de madurez ECS (ECS insight), que combina las necesidades de gestión de recursos del cliente y productos relacionados en la práctica en la nube, desde las seis dimensiones de capacidades básicas, administración de costos, automatización, confiabilidad, flexibilidad y seguridad para ayudar a los usuarios a analizar y ubicar riesgos potenciales de operación y mantenimiento, y recomendar soluciones correspondientes y mejores prácticas para ayudar a los usuarios empresariales a reducir costos y aumentar la eficiencia y mejorar la continuidad del negocio.

Todo el tiempo, el equipo de computación elástica espera mejorar la eficiencia de la operación y el mantenimiento de los clientes en la nube a través de la optimización continua de la experiencia y la construcción de herramientas relacionadas. El año pasado, compilamos documentos técnicos que incluyen operación y mantenimiento automatizados y creamos herramientas relacionadas visitando a los clientes y combinando algunas prácticas de entrega en la nube.
inserte la descripción de la imagen aquí

En diciembre de 2021, el equipo de computación elástica comenzó a introducir la operación y el mantenimiento automatizados de CloudOps en la nube. En ese momento, todos se dieron cuenta de que cuando fuera de línea se convierte en línea, el uso de recursos y el enfoque en el cliente también cambiarán.

DevOps en la nube no es exactamente lo mismo que trasladar la práctica de CloudOps fuera de línea a la nube. Por lo tanto, en el informe Puppet de 2021, según varias respuestas de la encuesta, el 65 % de las empresas en etapa intermedia afirman que ya han comenzado a utilizar los recursos de la nube.

Sin embargo, según los resultados de la encuesta, solo el 20% de las empresas aprovecha al máximo algunas funciones o ventajas de la propia nube para realizar negocios. En 1.0, en función de las diferencias en la entrega de recursos y la operación y el mantenimiento en la nube, propusimos desde la perspectiva de reducir costos, mejorar la velocidad de entrega, mejorar la automatización, mejorar la flexibilidad, mejorar la confiabilidad del sistema y mejorar la seguridad empresarial. Algunas mejores prácticas y herramientas correspondientes.
inserte la descripción de la imagen aquí

En el último período de tiempo, la ecología y las tendencias de las operaciones también han cambiado. Se ha vuelto a prestar atención a una gran cantidad de contenido que ya existía en los primeros días por varias razones.

Esto implica versiones mejoradas de diferentes dimensiones de operaciones, con diferentes enfoques. Algunos se aplican en dominios comerciales verticales y otros enfatizan la implementación de prácticas de operación y mantenimiento.

Entre ellos, FinOps es una combinación de Finance+DevOps. Se enfoca en mejorar la utilización y el rendimiento de los recursos en la nube. Requiere una estrecha colaboración entre los equipos de negocios, finanzas e ingeniería para mejorar las capacidades de visualización de costos a través de datos, optimizando así los costos.

Según la evaluación de 2022 de Flexera, alrededor del 32 % del gasto anual en la nube se desperdicia debido a recursos inactivos o baja utilización. En los últimos 12 meses, el tamaño de los equipos participantes de FinOps ha crecido un 75 %.

En los últimos años, debido al gran desarrollo de la inteligencia artificial y el aprendizaje automático, AIOps ha vuelto a surgir, centrándose en cómo aplicar tecnologías relacionadas a varios escenarios de operación y mantenimiento para lograr la reducción de costos y el aumento de la eficiencia. De los informes de evaluación relevantes, se puede ver que se espera que el tamaño del mercado global de AIOps alcance los 11,25 mil millones de dólares estadounidenses en 2025.

Además, DevSecOps es una combinación de Security+DevOps, que es una práctica de seguridad como responsabilidad compartida a lo largo de todo el ciclo de vida de TI.

Finalmente, en el campo del aprendizaje automático, MLOps es la aplicación de la metodología y herramientas DevOps en el campo de ML. Según un informe de MarketsandMarkets, se espera que el tamaño del mercado global de MLOps alcance los 490 millones de dólares para 2025.

El concepto de DevSecOps fue propuesto por primera vez por expertos y profesionales en el campo de la seguridad de TI en 2012. En el período posterior, las conferencias de Gartner y RSAC fortalecieron gradualmente los conceptos y prácticas relacionados, especialmente el concepto de seguridad. en todo el ciclo de vida de DevOps. En la actualidad, la integración de múltiples factores, como la gestión de riesgos y la gobernanza del cumplimiento, en el marco de DevSecOps se ha convertido en una de las tendencias de la industria.
inserte la descripción de la imagen aquí

No importa qué tipo de Ops sea, en última instancia, gira en torno a los recursos. Los recursos incluyen infraestructura, equipos de aplicaciones, procesos comerciales de datos, etc. Los participantes típicos incluyen integradores de la nube. En la nube, la plataforma en la nube es el miembro más importante del rol de integrador. Por supuesto, hay otros roles diferentes, incluido el personal de desarrollo, operación y mantenimiento más tradicional y el personal de operación. También hay algunos expertos en el campo de los negocios, algunos financieros, algunos de seguridad.

Desde la perspectiva de la plataforma en la nube, lo primero que hacemos es mejorar la experiencia del usuario y la riqueza de capacidades de los productos básicos, que es la base de CloudOps. Puede evitar problemas de raíz. Tomemos como ejemplo el producto ECS. En el último año, nos hemos desarrollado desde la perspectiva de las órdenes de trabajo, analizamos gradualmente los problemas de los clientes y los resolvimos desde el producto mismo. A juzgar por los resultados de marzo, el número de órdenes de trabajo ha disminuido considerablemente año tras año, lo que es un muy buen resultado, y también verifica que la experiencia del producto en sí es la parte más básica de CloudOps.

Además, la plataforma en la nube protege algunas características de los recursos, por lo que algunas prácticas de operaciones en la nube han sufrido los cambios correspondientes. Por lo tanto, es necesario integrar los requisitos de operación y mantenimiento de recursos de los clientes y la forma en que se utilizan los recursos en la nube, y construir las mejores prácticas de Ops en la nube a través de capacidades de productos diversificados.Esta es otra parte que necesita una construcción continua.

Finalmente, desde la perspectiva de los roles comerciales, siempre hemos creído que los equipos comerciales, incluidos los roles de desarrollo/operación y mantenimiento, son participantes importantes en CloudOps, pero también son los principales contribuyentes a las mejores prácticas de CloudOps. Muchos usuarios tienen prácticas de gestión de recursos muy ricas.

En el último período de tiempo, nuestro equipo de productos y nuestro equipo de I+D han visitado muchos clientes para comprender sus escenarios y métodos de trabajo existentes, que se utilizan para guiar nuestro trabajo de seguimiento.

Con base en la información anterior, la práctica de gestión de recursos se divide en tres partes, detección de problemas, resolución de problemas y prevención de problemas. Entre ellos, al descubrir problemas, debemos pensar en cómo establecer normas de mejores prácticas y capacidades de diagnóstico basadas en datos. Entre ellos, el más crítico es establecer una especificación de mejores prácticas. En segundo lugar, las capacidades de diagnóstico estandarizadas basadas en datos pueden ayudar a todos a encontrar problemas.

Porque con capacidades de especificación y diagnóstico, los problemas se pueden resolver y prevenir. Esto lleva al libro blanco y las herramientas de conocimiento que se presentarán a continuación.
inserte la descripción de la imagen aquí

Al observar los cambios de tendencia en la industria, continuamos comunicándonos con los clientes, visitamos para comprender los escenarios de aplicación utilizados por los clientes y desarrollamos nuestras propias capacidades de productos. Después de que resolvimos esta información, lanzamos el documento técnico de CloudOps.

Hay dos puntos a destacar aquí:

Primero, sobre el modelo de madurez. Dividimos el uso de la nube por parte de los usuarios en varios niveles. Al principio, las empresas simplemente comenzaron a usar recursos y comenzaron a prestar atención a la automatización, la elasticidad, la seguridad, el cumplimiento y otras características utilizadas en la nube. En la práctica, comience a contactar y usar conscientemente el producto. Las empresas simplemente habilitan funciones relacionadas por configuración predeterminada. Con la profundización gradual de la etapa posterior, alcanzará gradualmente diferentes etapas, como intermedia, avanzada, estandarizada e inteligente.

El segundo punto es en términos de clasificación: al dividir los diversos campos de CloudOps, hemos introducido capacidades de automatización. La capacidad de automatización se refiere a cómo usamos herramientas y sistemas para reducir o incluso reemplazar por completo las operaciones manuales, a fin de mejorar la eficiencia relacionada con la operación y el mantenimiento. Además, las clasificaciones típicas incluyen capacidades elásticas, capacidades de confiabilidad, capacidades de cumplimiento de seguridad, capacidades de administración cuantitativa de costos y recursos, etc.
inserte la descripción de la imagen aquí

La figura anterior muestra la imagen general de los productos CloudOps de computación elástica de Alibaba Cloud. Puede ver que la capa inferior son las capacidades básicas de IaaS. En este nivel, como mencionamos anteriormente, es la base de todo CloudOps, y la computación elástica se ha comprometido a mejorar estas capacidades básicas y mejorar la experiencia.

En la capa superior de productos básicos se encuentra la matriz de productos de CloudOps. Como mencionamos en el documento técnico de CloudOps anterior, lo hemos dividido en cinco dimensiones, a saber, administración de costos, servicios de automatización, servicios de confiabilidad, servicios elásticos y servicios de cumplimiento de seguridad.

Entre los servicios elásticos con los que todos están más familiarizados, tomando como ejemplo la herramienta de escalado elástico más típica, los clientes pueden expandir o reducir automáticamente los recursos según la carga del negocio. En Elastic Resource Guarantee, proporcionamos métodos de uso de recursos para diferentes escenarios. Los clientes pueden leer ejemplos y administrar recursos al reservar paquetes de capacidad y reservas de capacidad.

inserte la descripción de la imagen aquí

ECS utiliza el modelo de evaluación y análisis de madurez, una herramienta abierta en la consola. Es la realización de "varias mejores prácticas y estándares normativos relacionados" que mencionamos en el libro blanco.

Como se muestra en la figura anterior, en la primera parte, puede ver que la herramienta puede diagnosticar la madurez actual de diferentes dimensiones en función del uso de recursos del usuario que ha iniciado sesión actualmente, como el uso de capacidades de automatización, capacidades básicas, información sobre capacidades elásticas y capacidades de seguridad.

En la segunda parte, puede ver la puntuación de diferentes dimensiones, incluidos los elementos de puntuación y los elementos faltantes. Por ejemplo, en la dimensión de estabilidad, actualmente hay diez elementos de evaluación, y el usuario puede tener actualmente siete elementos de puntuación y tres elementos perdedores.

En estos tres puntos perdidos, también haremos algunas mejoras y daremos algunas soluciones prácticas correspondientes para facilitar la mejora y la optimización basadas en la base. Si el sistema detecta que el usuario no ha utilizado instantáneas para realizar una copia de seguridad de los datos en los últimos siete días, el usuario puede realizar algunas optimizaciones sobre este problema. Por supuesto, CloudOps es un proceso continuo. Ya sea un documento técnico o una herramienta de conocimiento, es un resumen de algunas de las mejores prácticas que hemos trabajado con los clientes en el pasado. Incorporaremos más contenido nuevo en el futuro, gracias .

Haga clic en "Leer el texto original" al final del artículo para ver la maravillosa transmisión en vivo, siga la cuenta oficial de Cloud Evangelist y responda a la palabra clave "CloudOps", y lea/descargue "CloudOps White Paper 2.0 para operación y mantenimiento automatizados en la nube" inmediatamente.

Xu Haihong, experto técnico sénior de Computación elástica en la nube de Alibaba: Modelo de madurez de O&M de automatización en la nube

Supongo que te gusta

Origin blog.csdn.net/bjchenxu/article/details/129956668
Recomendado
Clasificación