Perspectivas para los ingenieros de operación y mantenimiento de computación en la nube

Actualmente en la era de la nube, las perspectivas laborales de los ingenieros de operación y mantenimiento de computación en la nube son aún muy amplias. Las principales empresas de Internet, como Alibaba Cloud Computing, Didi, Douyin, etc., utilizan actualmente la computación en la nube.

El nivel salarial de los ingenieros de operación y mantenimiento de computación en la nube también es muy impresionante.

Los ingenieros de operaciones (Operaciones) son los principales responsables de mantener y garantizar la alta disponibilidad de todo el servicio, mientras optimizan continuamente la arquitectura del sistema, mejoran la potencia del diseño, optimizan la utilización de los recursos y mejoran el ROI general. Más tarde, también pueden pasar a la operación de Devops y desarrollo de mantenimiento ingenieros y arquitectos desarrollan.

El 90 % del uso empresarial se ejecuta en el canal Linux, e incluso la computación en la nube de alto nivel, los macrodatos y el Internet de las cosas necesitan una buena operación y mantenimiento como respaldo. Incluso los teléfonos Android que usamos tienen una arquitectura Linux en la parte inferior. Las comunicaciones, las finanzas, Internet, la educación, el comercio electrónico, la fabricación de maquinaria, la industria aeroespacial militar, etc., son inseparables de Linux.

En el campo de la operación y el mantenimiento, la dirección de desarrollo general sigue siendo el trabajo de operación y mantenimiento. Se espera que se desarrolle en grandes empresas o proveedores de la nube, y algunas personas pueden transformarse en arquitectos o administradores. Existe un amplio y enorme stack tecnológico en el campo de la operación y el mantenimiento. Pero el problema es que estas pilas de tecnología son demasiado complejas. Sin tres a cinco años de acumulación de experiencia, es imposible para usted ingresar realmente al campo de operación y mantenimiento de alto nivel. Por lo tanto, si desea tener éxito en el campo de la operación y el mantenimiento, se recomienda que planifique su propio camino de aprendizaje.

Para convertirse en un excelente ingeniero de operaciones y mantenimiento, debe dominar muchas habilidades, entre las cuales las tres principales son las siguientes:

1) Establecimiento de la arquitectura de TI. Responsable de participar y revisar la racionalidad y operatividad de la planificación de la arquitectura para garantizar un funcionamiento seguro, eficiente y estable del sistema una vez que esté en línea.
2) Garantía de funcionamiento diario. Responsable del uso de habilidades de operación y mantenimiento, canales de operación y mantenimiento, para garantizar la gestión integral y la gestión del ciclo de vida completo de los dispositivos conectados a la red, y para garantizar que el estado del equipo, el negocio y la seguridad puedan ser monitoreados y controlados.
3) Optimización del sistema. Debido a las limitaciones de la propia arquitectura del servidor Linux, las fallas del sistema son inevitables, pero a través de una planificación razonable y una operación y mantenimiento efectivos, la frecuencia de las fallas se puede reducir en gran medida y se puede mejorar la eficiencia de la recuperación comercial.

Mapa de conocimientos y habilidades de los ingenieros de operación y mantenimiento de computación en la nube

Ruta de aprendizaje de ingeniero de operación y mantenimiento de computación en la nube:

1. Domina un lenguaje de programación

Creo que es una buena opción aprender Python e ir en este momento. Preste atención a dos puntos: uno es la base y el otro es la capacidad práctica.

Para aprender un idioma, primero debes leer un libro y luego hacerlo tú mismo. Aquellos que piensan que un idioma se puede aprender solo leyendo libros son ingenuos. Aquellos que solo se enfocan en la programación y no leen libros definitivamente tendrán fuertes habilidades prácticas y bajos niveles en el futuro.

Los novatos no se apresuran por el éxito. Deberían invertir un poco más de tiempo en aprender los conceptos básicos primero. Cuanto más sólida sea la base, mayor será el nivel de programación en el futuro. Se necesitan al menos tres meses para leer un libro.

La lectura incluye principalmente principios de informática y libros relacionados con el idioma que has aprendido (si quieres empezar, no elijas deliberadamente cuál es mejor, es bueno para principiantes).

Al leer un libro, definitivamente encontrarás varios conceptos que no entiendes, y la relación entre varios conceptos no es fácil de entender y comprender. Muchos novatos se sienten intimidados y no pueden entender. En este momento, debemos aprender a persistir, persistir en la lectura y leer repetidamente. Presta atención a recopilar conceptos que realmente no entiendes y tenlos en cuenta. En este momento, lo mejor es no encontrar a alguien que responda. Es mejor leer todos los libros tres veces antes de pedirle a alguien que responda, esto profundizará su comprensión de la pregunta y la persona que responde estará dispuesta a responder. Solo haz cualquier pregunta. Por un lado, el encuestado pierde la paciencia, por otro lado, no tiene impresión y es propenso a la dependencia.

Después de tener algunos conocimientos básicos, debe intentar instalar el entorno de programación usted mismo.

2. Sistema operativo básico y línea de comandos Linux, habilidades necesarias para su operación y mantenimiento

Se puede decir que el sistema operativo Linux y su línea de comandos son los conocimientos básicos que todo programador debe dominar, incluida la instalación del sistema operativo Linux principal, la instalación y configuración del software, los comandos básicos de Linux, la gestión de derechos, la gestión de usuarios, la gestión de redes, monitoreo del sistema, conocimiento de scripting Shell, automatización Ansible, etc. Dado que la mayoría de las empresas utilizan Linux, es una habilidad imprescindible para los operadores.

Esta parte del conocimiento es muy práctica, se recomienda instalar un Ubuntu localmente en la computadora o a través de una máquina virtual, o comprar un servidor en la nube CVM en Alibaba Cloud, en lugar de solo leer libros o videos.

Más recomendados son "Linux Command Line Encyclopedia", "Bird Brother's Linux Private Kitchen", "Linux/UNIX System Programming Manual"

3. Conocimiento de la red, incluida la configuración de dispositivos de red, protocolo TCP/IP, VLAN, configuración de enrutamiento, división en subredes, seguridad de red, monitoreo de red, etc.

Un gran espacio de direcciones IP se divide en múltiples subredes más pequeñas, la red de área local virtual (VLAN) se divide para facilitar la administración y mejorar la seguridad de la red, y el enrutamiento debe configurarse en los enrutadores para garantizar la comunicación entre diferentes subredes.

4. Conocimiento de bases de datos , incluida la instalación y configuración de bases de datos de uso común, las bases de datos relacionales están representadas por MySQL, SQL Server y Oracle, las bases de datos no relacionales MongoDB y Redis.

Conocimiento teórico de base de datos, diseño de bases de datos, uso de herramientas de conexión de bases de datos, adición, eliminación y modificación de bases de datos, respaldo y recuperación de bases de datos, administración de autoridades y usuarios de bases de datos, optimización de bases de datos, alta disponibilidad de bases de datos, etc.

5. Conocimiento de seguridad , incluida la conciencia diaria de seguridad, control de firewall, ACL (Lista de control de acceso), configuración de complejidad de contraseña, auditoría de seguridad, etc.

6. Conocimiento de almacenamiento , incluida la red de almacenamiento, la partición del disco, la gestión del volumen lógico LVM, la matriz de discos, la tecnología iscsi, etc.

7. Tecnología de contenedores , Docker es un contenedor de aplicaciones de código abierto, que empaqueta el software de la aplicación, sus dependencias y el entorno operativo en una imagen espejo, que puede ejecutarse en cualquier sistema operativo Linux popular.

Estos conocimientos básicos se pueden aprender a través de libros, videos, blogs, etc. Gran parte del conocimiento se basa en la habilidad práctica, por lo que es muy importante moverse.

Cree y configure entornos de aplicaciones comunes

Después de aprender los conocimientos básicos de operación y mantenimiento, es necesario aplicar estos conocimientos de manera integral, y la práctica se puede fortalecer mediante la creación y configuración de entornos de aplicación comunes.

Necesitamos dominar el software de servidor web de uso común como Nginx, Apache y Tomcat, etc., el software de base de datos como Mysql, Oracle, Redis y MongoDB, etc. Para aprender a descargar e instalar este software, necesitamos saber su principal ubicación del archivo de configuración, composición del directorio, puertos predeterminados, métodos de inicio y apagado del servicio, escenarios aplicables, etc.

Además, Nginx, Apache y Tomcat admiten la configuración de host virtual, es decir, un servidor puede admitir varios sitios web o aplicaciones, lo que puede maximizar el uso de los recursos del servidor.

Al principio, se recomienda crear un entorno independiente para la práctica primero y, luego, hacer una transición gradual a un clúster y una arquitectura de alta disponibilidad.

  • Arquitectura distribuida: divida el sistema en múltiples componentes independientes, que pueden ejecutarse en diferentes servidores y trabajar juntos a través de la comunicación de red. La arquitectura distribuida generalmente usa el patrón de arquitectura de microservicios, y cada microservicio es responsable de una función comercial específica y se comunica a través de la interfaz API. La arquitectura distribuida puede mejorar la escalabilidad, la confiabilidad y la tolerancia a fallas del sistema, y ​​es adecuada para sistemas a gran escala y escenarios de alta concurrencia.

LÁMPARA (Linux+Apche+Mysql/Mariadb+Php/Python)

Pertenece a una arquitectura típica en la arquitectura centralizada, que es la abreviatura de sistema operativo Linux, servidor web Apache, base de datos MySQL y lenguaje de programación PHP. En la arquitectura LAMP, tanto el servidor web como el servidor de aplicaciones se ejecutan en el mismo servidor y realizan la interacción y gestión de datos a través de la base de datos MySQL. Aunque la arquitectura LAMP adopta un modelo de arquitectura centralizada, también se puede aplicar al desarrollo de algunos sitios web y aplicaciones web de tamaño pequeño y mediano, y tiene las ventajas del código fuente abierto, la facilidad de uso y el bajo costo.

En la operación de Linux, Apache se instala para recibir solicitudes de acceso, Mysql se usa para almacenar datos y Php o Python se usan para desarrollar aplicaciones. Una aplicación típica de LAMP es monitorear Zabbix.

  • Arquitectura centralizada: ejecute todos los componentes del sistema en el mismo servidor y realice la interacción y gestión de datos a través de una única base de datos. Una arquitectura centralizada generalmente usa un patrón de arquitectura de aplicación monolítica, donde todos los módulos funcionales se empaquetan juntos para formar un solo programa. La arquitectura centralizada simplifica el desarrollo y la implementación, y es adecuada para sistemas pequeños y medianos y escenarios de baja concurrencia.

La arquitectura Nginx + Tomcat puede ser una arquitectura distribuida, porque Nginx y Tomcat son dos componentes independientes que pueden ejecutarse en diferentes servidores y trabajar juntos a través de la comunicación de red.

Normalmente, Nginx actúa como un servidor proxy inverso, recibe las solicitudes de los clientes y las reenvía al servidor de aplicaciones Tomcat para su procesamiento.El servidor de aplicaciones Tomcat es responsable de procesar la lógica comercial y el almacenamiento de datos. La comunicación entre Nginx y Tomcat se puede realizar a través del protocolo HTTP o AJP. La combinación de los dos proporciona servicios externos. La ventaja de esto es que el servidor de aplicaciones back-end se puede expandir y el servicio externo no se ve afectado a través de Nginx como la única salida. Además, tanto Nginx como Tomcat admiten el modo de clúster, que puede lograr una alta disponibilidad y escalabilidad mediante el equilibrio de carga.

Clasificación de los puestos de operación y mantenimiento

En el campo de la operación y el mantenimiento, la dirección general de desarrollo sigue siendo el trabajo de operación y mantenimiento. Se espera que se desarrolle en grandes empresas o proveedores de la nube, y algunas personas pueden transformarse en arquitectos o administradores. Existe un amplio y enorme stack tecnológico en el campo de la operación y el mantenimiento. Pero el problema es que estas pilas de tecnología son demasiado complejas. Sin una acumulación de experiencia de tres a cinco años, es imposible para usted ingresar realmente al campo de operación y mantenimiento de alto nivel. Por lo tanto, si desea tener éxito en el campo de la operación y el mantenimiento, se recomienda que planifique su propio camino de desarrollo.

La clasificación de operación y mantenimiento no es muy clara, la operación y el mantenimiento comunes se pueden dividir en las siguientes categorías.

1. Operación y mantenimiento de escritorio

Operación y mantenimiento de escritorio, responsable de la configuración, administración y mantenimiento de terminales de usuario, clientes, servidores y otros equipos, para garantizar que estos equipos puedan funcionar de manera normal y estable.

Tales como administración de impresoras, mantenimiento de fallas de software de oficina, equipos de proyectores de administración de salas de conferencias, administración de equipos de red, etc.

En general, las pequeñas empresas no tienen una operación y mantenimiento de escritorio dedicados, y el administrador de la red también es responsable de la función de operación y mantenimiento de escritorio.

Si ha realizado operaciones de escritorio y mantenimiento durante un período de tiempo, definitivamente comprenderá estos escenarios para instalar software para usuarios, construir redes empresariales y reparar computadoras e impresoras cuando sea escandaloso.

2. Operación y mantenimiento del sistema

Principalmente mantener y administrar servidores, sistemas operativos y aplicaciones, mejorar el rendimiento del servidor y garantizar un funcionamiento seguro y estable de servidores y sistemas operativos. Necesita dominar las habilidades relacionadas con Linux y Windows, la tecnología de red, la tecnología de administración de discos, la tecnología de seguridad, etc.

El contenido principal del trabajo es

1) Monitoreo de servidores y sistemas

El objetivo principal de la supervisión de la configuración del servidor es garantizar que el servidor pueda funcionar de manera eficiente y estable. La plataforma de monitoreo puede monitorear en tiempo real el estado de ejecución del servidor, el uso de recursos, etc.. Cuando ocurre un problema, puede localizarlo rápidamente y acelerar la resolución del problema.

El contenido monitoreado incluye el servidor, el estado de funcionamiento del sistema operativo, la capacidad del disco del servidor, la memoria disponible, el uso de la CPU, el tráfico de la tarjeta de red, el estado del servicio del sistema, la supervisión de elementos personalizados, etc.

2) Los servidores y sistemas se refuerzan regularmente

El endurecimiento oportuno de servidores y sistemas sin dejar puertas traseras es un medio eficaz para reducir los ataques y mejorar el rendimiento general del sistema. El objetivo final es mejorar la seguridad del sistema.

Actualice el kernel del sistema en la etapa inicial, cierre servicios innecesarios, elimine usuarios redundantes, cierre puertos de alto riesgo, establezca el tiempo de espera de cierre de sesión del servidor, establezca el tiempo de almacenamiento del registro del sistema, establezca la complejidad de la contraseña de la contraseña de servicio, establezca el período de validez de la contraseña de la contraseña, habilite el registro de comportamiento del servidor y registros de auditoría, establezca la cantidad de registros de historial para guardar, etc.

Realice un seguimiento regular de las vulnerabilidades del servidor, incluida la actualización de la versión de Bash, la actualización de la versión de Sudo, la actualización de la versión de Openssh, etc.

3) Gestión de la seguridad del servidor y del sistema.

Configuración del firewall del servidor, configuración de la lista blanca y negra del servidor, control de acceso, copia de seguridad y recuperación de datos importantes, etc. Para ocultar la información del número de versión del middleware, como ocultar la versión de Nginx y el número de versión de Tomcat, también es necesario actualizar periódicamente la versión del middleware.

3. Operación y mantenimiento de la red

Operación y mantenimiento de la red, principalmente responsable de la gestión y el mantenimiento de los equipos de red, como la configuración de conmutadores y enrutadores, la configuración de la red del servidor, la gestión del nivel de red del sistema, la gestión de direcciones IP, etc.

En el trabajo diario, la red es inseparable, y la operación y el mantenimiento de la red juegan un papel clave en la estabilidad y seguridad de la red.

La comunicación entre varios sistemas también es inseparable de la red, lo que requiere operación y mantenimiento de la red para brindar soporte a la red y habilitar las políticas de red correspondientes.

Familiarícese con los sistemas operativos de red más utilizados, como Windows 2000, Windows 2003, UNIX y Linux. La construcción de una red de área local puede usar una variedad de sistemas operativos.Después de todo, dominar más puede manejar los problemas mejor y con más opciones.

En tercer lugar, domine el método de configuración de enrutamiento y conmutación de equipos. Se puede decir que Internet está construido por enrutadores y conmutadores. Un ingeniero de redes calificado debe poder completar la arquitectura de la LAN solo. Es imposible imaginarlo sin los conocimientos pertinentes.

Finalmente, también debe dominar los conocimientos relevantes de cableado integrado e integración de redes. Al hacer los planes del proyecto, es necesario considerar completamente la selección del equipo y el diseño de la topología.Es necesario comprender el cableado integrado, de modo que sea posible lograr una red fluida, coincidencia de hardware, sin cuellos de botella en la red y la más alta relación rendimiento-precio.

La estructura de conocimiento anterior es solo para ingenieros de administración y mantenimiento de red. Si hay bases de datos profesionales involucradas en la red, también se requiere dominio de las declaraciones SQL y familiaridad con ciertas bases de datos, como ORACLE, SYBASE, SQL SEVER, etc.

4. Operación y mantenimiento de bases de datos (DBA)

La operación y el mantenimiento de la base de datos, como su nombre indica, es responsable del trabajo relacionado con la base de datos, como el diseño de la tabla de la base de datos, la instalación y configuración de la base de datos, el mantenimiento de la seguridad de la base de datos, la supervisión de la base de datos, la copia de seguridad y recuperación de la base de datos, la alta disponibilidad de la base de datos, etc., para garantizar el funcionamiento seguro y estable de la base de datos.

5. Desarrollo y mantenimiento (DevOps)

La operación y el mantenimiento del desarrollo no significa que el desarrollo y la operación y el mantenimiento se tengan en cuenta al mismo tiempo, sino que el desarrollo y la operación y el mantenimiento se ayudan entre sí, fortalecen la comunicación y utilizan la tecnología de automatización para mejorar la eficiencia del trabajo entre los equipos.

Dado que DevOps se basa en Linux, debe dominar las habilidades relacionadas con Linux y la gestión del sistema. Además, debe dominar habilidades como el control de versiones representado por Git, la integración continua de Jenkins, la herramienta de automatización Ansible, etc.

Al dominar la tecnología, se requiere un fuerte espíritu de unidad y cooperación.

Acerca del León Moro Legendario

Chuanzhi Mole Lion es una marca de capacitación de talento digital establecida por Guangzhou Chuanzhi Information Technology Co., Ltd. para la certificación y la red en la nube de Alibaba. Chuanzhi Mole Lion se estableció en 2019 y se compromete a difundir teorías educativas líderes y abogar por una educación más eficaz y eficiente. En el campo de la educación vocacional de TI, estudiamos la integración de libros de texto y métodos de enseñanza y recursos de enseñanza de disciplinas relacionadas, promovemos el aprendizaje y el desarrollo de talentos de TI a través de la plataforma de servicio de aprendizaje de desarrollo propio y estamos comprometidos a cultivar talentos digitales para la nube de China industria de la computación

Bajo el concepto de difundir conocimiento y alcanzar el futuro, Morelion logró una cooperación profunda con Alibaba Cloud en agosto de 2021 y se convirtió en un socio estratégico de capacitación certificado por Alibaba Cloud. Además, Morelion ha firmado acuerdos de cooperación laboral con más de 200 fabricantes de Internet para capacitar y entregar continuamente talentos orientados a aplicaciones orientadas al futuro para las empresas y el país.

Supongo que te gusta

Origin blog.csdn.net/Cheese_Y/article/details/131551606
Recomendado
Clasificación