使用Zabbix监控位于两台不同的机器上的文件是否一致

生产上有一需求,要把某个文件同步到另一台备机上,备机启动程序的时候需要引用这个文件,以便能够实现failover。文件同步的方法这里不言,这里主要讨论怎么通过zabbix平台实现对两个位于不同机器上的文件是否一致进行监控,若出现不一致的情况立即告警,需要人为干预。

在网上也搜索了好多帖子,差不多都使用了脚本来实现,感觉都不适合自己。于是曲曲折折走了一段弯路,最开始打算用Python脚本实现的,脚本都准备好了也测试过了。后来看到了calculate item这种方式,只是单纯的通过zabbix就能实现了,所以何乐而不为呢,于是就用这种方案了。现在把最后方案整理一下,与大家分享一下。

一、首先创建合适的基础监控项

我一开始就考虑着使用vfs.file.md5sum和vfs.file.cksum这两个item来实现。后来操作起来发现vfs.file.cksum比较适合,因为vfs.file.cksum的返回值是一串数字,便于下一步计算。

1.首先在源主机上创建一个item(注意这里面的Key和Type of information参数设置)

2.备机上同样的方法创建一个item(这里不贴图了)

二、使用item类型中的Calculated来实现两个监控项之间的比较

用calculate可以对item进行计算,计算方式主要靠一系列的表达式组成。计算后的结果存放在数据库中,也就是说历史数据、趋势数据都会存在数据库中。这就意味着可以对calculate item监控项进行告警配置。详细介绍请点击链接

 https://www.zabbix.com/documentation/2.4/manual/config/items/itemtypes/calculated

扫描二维码关注公众号,回复: 2006682 查看本文章

Key在每个HOST中都是唯一的,不能重复。其表达式如下:

func(<key>|<hostname:key>,<parameter1>,<parameter2>,...)

各个参数的含义如下图所示:

现在在备机上创建一个calculate item监控项,来比较两个文件是否一致。通过前者的cksum值与后者sksum作差运算

注:如果操作完成后中出现下面提示的错误,需要检查一下Type of information设置:

这里解释一下出现这个问题的原因:当前者cksum值比后面大的时候正常显示,而当前值比后面小的时候就会出现上面这种结果,究其原因也就是类型不同其能包含的值也不同。

下面详细介绍一下item参数中的Type of information

Numeric(unsigned):64位无符号的整数

Numeric(float):浮点数类型(从zabbix2.2开始,接收的值大小可以支持如1e+70、1e-70.)

Character:字符(字符串)类型数据限制为255B

Log:日志文件,必须使用的Key为log[]和logrt[]

Text:文本(text)不限制大小

三、创建触发器,测试结果

在备机上创建一个触发器,当结果不为0时产生告警

手动操作一下让两个文件不一样时能立刻产生告警:

目的达成!

更多Zabbix相关教程集合: 

ZABBIX 的详细介绍请点这里
ZABBIX 的下载地址请点这里

猜你喜欢

转载自www.linuxidc.com/Linux/2017-11/148741.htm