Monitoreo del rendimiento del servidor Prometheus y resumen del proyecto
01: objetivo
- Herramienta de monitoreo del rendimiento del servidor
- todo como comprensión
- Implementar la implementación, instalación y monitoreo de compilaciones.
- resumen del proyecto
- Análisis de Requisitos, Arquitectura Técnica
- Diseño de almacén de datos: división temática, diseño jerárquico, diseño dimensional.
- Optimización, problema, volumen de datos y tamaño del clúster.
- plantilla del curriculum vitae
02: Requisitos de seguimiento y herramientas comunes
-
Objetivo : comprender los requisitos de monitoreo del rendimiento del servidor y las herramientas de monitoreo comunes.
-
camino
- Paso 1: requisitos de seguimiento
- paso 2: herramientas comunes
-
implementar
-
necesidades de seguimiento
- Pregunta: La cantidad de datos está aumentando y la cantidad de máquinas está aumentando. ¿Cómo garantizar el funcionamiento estable de todos los servidores y garantizar que no se interrumpan todos los servicios?
- Recursos: CPU, memoria, disco, red.
- Umbral: 80%
- Solución: Un sistema de monitoreo eficiente puede analizar y organizar los datos de operación y mantenimiento, hacer que el trabajo de operación y mantenimiento sea transparente y visualizado, facilitar que el personal de operación y mantenimiento descubra los problemas a tiempo, garantizar el funcionamiento estable del sistema y mejorar la operación. y eficiencia de mantenimiento, satisface diferentes necesidades comerciales y se aplica a diferentes servidores. El escenario también es un factor importante para determinar el costo y la eficiencia de la operación y el mantenimiento.
- necesidad
- Monitoreo de cobertura : monitorear el funcionamiento de todas las máquinas y todos los servicios.
- Contenido de monitoreo unificado : CPU, memoria, disco, red IO
- Separación de alarma y visualización : monitoreo en tiempo real de la carga de la máquina, operación del programa y realización de alarmas e informes de diferentes maneras para diferentes negocios.
- Pregunta: La cantidad de datos está aumentando y la cantidad de máquinas está aumentando. ¿Cómo garantizar el funcionamiento estable de todos los servidores y garantizar que no se interrumpan todos los servicios?
-
herramientas comunes
-
zabbix
基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案 zabbix能监视各种网络参数,保证服务器系统的安全运营 提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题
-
Nagios
一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的状态,交换机路由器等网络设备,打印机等 在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知
-
Prometeo
Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB),它启发于 Google 的 borgmon 监控系统,由工作在 SoundCloud 的 google 前员工在 2012 年创建,作为社区开源项目进行开发,并于 2015 年正式发布。 2016 年,Prometheus 正式加入 Cloud Native Computing Foundation,成为受欢迎度仅次于 Kubernetes 的项目。
-
-
-
resumen
- Comprender los requisitos de monitoreo del rendimiento del servidor y las herramientas de monitoreo comunes.