Architecture de surveillance de la banque Zabbix

[Introduction] Après plus de deux ans de développement, le système Zabbix d'une banque est progressivement passé d'un essai à petite échelle à un plus large éventail de scénarios couvrant le matériel, les applications, les plates-formes et les entreprises. L'architecture a évolué à partir d'un système de données unique central à un déploiement distribué de trois centres. En plus de remplacer progressivement l'ancien système de surveillance, de plus en plus de systèmes tiers ont également commencé à se connecter à Zabbix, en utilisant des données de surveillance d'exploitation et de maintenance massives pour réaliser le mode de fonctionnement d'exploitation et de maintenance intelligentes via l'API ou l'échantillonnage de base de données. Cet article partage l'expérience pratique de Zabbix dans les applications bancairesen termes de déploiement d'architecture, de dimensions de surveillance, de solutions d'automatisation et de gestion des opérations, dans l'espoir d'aider la majorité de ses pairs.

Présentation de la plateforme Zabbix

Présentation de la plate-forme

Zabbix est une solution open source de niveau entreprise qui fournit des fonctions de surveillance de système distribué et de surveillance de réseau basées sur une interface Web. Il peut surveiller divers paramètres réseau, assurer le fonctionnement sûr du système serveur et fournir un mécanisme de notification flexible pour permettre aux administrateurs système de localiser et de résoudre rapidement divers problèmes.Avec Zabbix, il est facile de réduire la lourde gestion du serveur d'exploitation et de maintenance tâches du personnel pour assurer le fonctionnement continu du système d'entreprise. Son backend utilise une base de données pour stocker la configuration de surveillance et les données historiques, qui peuvent être facilement connectées à des canaux tels que l'analyse de données et la personnalisation des rapports, et une API RESTful riche est ouverte sur le frontend pour que des plates-formes tierces puissent appeler. très bon sous la tendance DevOps actuelle.

processus de sélection

Nous avons commencé à contacter Zabbix en 2017. Nagios était auparavant le principal système de surveillance utilisé pour l'exploitation et la maintenance. Cependant, les fonctions de Nagios telles que l'affichage des pages, la configuration de la surveillance et l'automatisation ne sont pas particulièrement conviviales pour le personnel d'exploitation et de maintenance de l'infrastructure. retenu notre attention. Lors de l'exploitation et de la maintenance de l'infrastructure, il est nécessaire de faire face à divers scénarios de surveillance, tels que l'inspection des voyants de panne du serveur PC, l'évaluation de l'état de la baie de périphériques de stockage, la surveillance des ressources LPAR du mini-ordinateur, l'inspection multi-chemins du système d'exploitation, etc. Et Zabbix intégré fournit SNMP, IMPI, SSH

Supongo que te gusta

Origin blog.csdn.net/weixin_70923796/article/details/130469948
Recomendado
Clasificación