使用logstash监控微服务项目，并制定索引格式

一起养成写作习惯！这是我参与「掘金日新计划 · 4 月更文挑战」的第14天，点击查看活动详情。

上文通过配置已经连接了上了springboot项目，但是现在市场环境一般都是微服务项目，所以需要logstash监控多个服务，同时也需要将监控过来的日志按照固定规则转换成文档，这方方便我们接下来的查询和整理。

一.监控多服务器

1.配置背景

从两台服务器（服务器名称分别A,B）上分别获取日志，且日志索引不同。
A服务日志进行拦截，如果没有带"登录日志"字样的日志丢弃。

2.配置知识点

判断语句，if写法。
过滤器使用。
通过日期生成相同业务的不同索引。（可以通过index template查询）

3.修改log_to_es.conf

修改/logstash/bin中log_to_es.conf 文件，具体配置见下文。


input{
        //从服务器A获取日志，类型为A
        tcp {
			    mode => "server"
				host => "0.0.0.0"
                port => 5000
                codec => json_lines
				type=> "A"
        }
        //从服务器B获取日志，类型为B
		tcp {
			    mode => "server"
				host => "0.0.0.0"
                port => 4999
                codec => json_lines
				type=> "B"
 
        }
}
//过滤器，如果为A类型，且没有带"登录日志"字样的日志丢弃。
filter{
		if[type] == "A"{
			if([message] =~  "^(?!.*?登录日志).*$") {
				### 丢弃
				drop{}
			   }
			}
}
output{
                //将A类型的日志传输给elasticsearch，且命名索引为A-当前日期
				if[type] == "A"{
				    elasticsearch{
						hosts=>["192.168.XX.XX:9200"]
						index => "A-%{+YYYY.MM.dd}"
						    }
						}
				//将B类型的日志传输给elasticsearch，且命名索引为B-当前日期		
				if[type] == "B"{
				    elasticsearch{
						hosts=>["192.168.XX.XX:9200"]
						index => "B-%{+YYYY.MM.dd}"
					        }					
                        }
}
复制代码

二.将日志拆分成规范的Documents

看到上文的可以知道，springboot打印的日志为已|分隔开来的字符集合，所以为了使用条件查询，我们将该字符串解析出来，并组成规范的Documents。

1.修改log_to_es.conf

修改/logstash/bin中log_to_es.conf 文件，在filter中添加以下代码，在具体配置见下文。

        grok {
					match => {"message" => "\|%{DATA:userName}\|%{GREEDYDATA:operationName}\|%{DATA:timeFormat}\|%{DATA:ip}\|%{DATA:systemType}\|%{GREEDYDATA:logType}\|%{GREEDYDATA:method}\|%{GREEDYDATA:input}"}
				}
复制代码

上文的%{DATA:systemType} 第一个参数为数据类型，第二个参数为值的key。

DATA：为文字类型不包含_,:等特殊符号
GREEDYDATA:为文字类型可以包含_,:等符号
如果时间类型如2021-01-19 17:28:41匹配不到，需要更改为GREEDYDATA

前文springboot输出的日志为|test|日志-日志|2021-01-19 17:31:06|192.168.xx.xx|信息平台|接口日志|/system/LoginLog/selectLog|{"beginTime":"2021-01-19 17:28:41","endTime":"2021-01-19 17:28:43"}，分隔方式是与前文向对应的。

2.测试配置

在保存配置后可以使用kibana测试是否可以成功分隔。在这里插入图片描述如果匹配成功会出现上图示例，否则会报错。

三.logstash中@timestamp时区早8个小时解决方案

在博主的测试过程中，发现@timestamp的值会比真实时间早8个小时，所以在收集日志时，在上文配置文件的filter加入了以下配置，将时间弥补过来。

             ruby { 
				 code => "event.set('timestamp', event.get('@timestamp').time.localtime + 8*60*60)" 
			 }
			 ruby {
				 code => "event.set('@timestamp',event.get('timestamp'))"
			 }
			 mutate {
				 remove_field => ["timestamp"]
			 }
复制代码

在这里插入图片描述

四.logstash将@timestamp映射为其他字段

博主在使用springboot查询elasticsearch时遇到一个问题，想使用时间进行筛选，但是在spring boot中@timestamp获取不到。所以博主的解决方案是将@timestamp复制一个字段。

在上文配置文件的filter加入了以下配置。就可以解决以上问题。

            ruby {
				code => "event['time'] = event['@timestamp']"
			}
			mutate
			{
				add_field => ["time", "%{@timestamp}"]
			}	
复制代码

在这里插入图片描述这样就会会在索引添加一个time字段且类型为date。

五.全配置解析

通过以上讲解，大家已经了解每种配置的使用方式了。下面将讲解一下博主的业务需求与实现配置。

博主这有现有两台服务器，loginlog为认证服务器，打印的是登录日志，datalog业务服务器，打印的是接口日志。所以打印的日志格式不同，需要判断做不同的解析。所以有此需求的小伙伴可以参考下文配置。

input{
        tcp {
			    mode => "server"
				host => "0.0.0.0"
                port => 5000
                codec => json_lines
				type=> "datalog"
        }
		tcp {
			    mode => "server"
				host => "0.0.0.0"
                port => 4999
                codec => json_lines
				type=> "loginlog"
 
        }
}
filter{
			if[type] == "loginlog"{
			    grok {
					match => {"message" => "\|%{GREEDYDATA:loginMsg}\|%{GREEDYDATA:timeFormat}\|%{GREEDYDATA:userName}"}
				}
				if([message] =~  "^(?!.*?登录系统).*$") {
					### 丢弃
					drop{}
				   }
				}
			if[type] == "datalog"{	
				grok {
					match => {"message" => "\|%{DATA:userName}\|%{GREEDYDATA:operationName}\|%{DATA:timeFormat}\|%{DATA:ip}\|%{DATA:systemType}\|%{GREEDYDATA:logType}\|%{GREEDYDATA:method}\|%{GREEDYDATA:input}"}
				}	
			}
            ruby {
				code => "event['time'] = event['@timestamp']"
			}
			mutate
			{
				add_field => ["time", "%{@timestamp}"]
			}				 
}
output{
       
				if[type] == "datalog"{
				    elasticsearch{
						hosts=>["192.168.xx.xx:9200"]
						user => "elastic"
						password => "xxxx"
						index => "xxxx-%{+YYYY.MM.dd}"
						    }
						}
				if[type] == "loginlog"{
				    elasticsearch{
						hosts=>["192.168.xx.xx:9200"]
						user => "elastic"
						password => "xxxx"
						index => "xxxx-%{+YYYY.MM.dd}"
					        }					
                        }
}
复制代码