Ganglia实战指南

1、Ganglia简介

Ganglia是一款为HPC(高性能计算)集群而设计的可扩展的分布式监控系统,它可以监视和显示集群中的节点的各种状态信息,它由运行在各个节点上的gmond守护进程来采集CPU 、内存、硬盘利用率、I/O负载、网络流量情况等方面的数据,然后汇总到gmetad守护进程下,使用rrdtool存储数据,最后将历史数据以曲线方式通过PHP页面呈现。

Ganglia的特点如下:

  • 良好的扩展性,分层架构设计能够适应大规模服务器集群的需要;
  • 负载开销低,支持高并发;
  • 广泛支持各种操作系统(UNIX等)和cpu架构,支持虚拟机;

2、Ganglia组成

Ganglia监控系统有三部分组成,分别是gmond、gmetad、webfrontend,作用如下:

  • gmond: 即为ganglia monitoring daemon,是一个守护进程,运行在每一个需要监测的节点上,用于收集本节点的信息并发送到其他节点,同时也接收其他节点发过了的数据,默认的监听端口为8649。
  • gmetad: 即为ganglia meta daemon,是一个守护进程,运行在一个数据汇聚节点上,定期检查每个监测节点的gmond进程并从那里获取数据,然后将数据指标存储在本地RRD存储引擎中。
  • webfrontend: 是一个基于web的图形化监控界面,需要和Gmetad安装在同一个节点上,它从gmetad取数据,并且读取RRD数据库,通过rrdtool生成图表,用于前台展示,界面美观、丰富,功能强大。

猜你喜欢

转载自blog.csdn.net/qq_35029061/article/details/132308883