能不能让log4j跑的“更快”,对业务总体执行时间影响更小?

最近事情不多,翻了一下log4j的源代码,发现这个一直跟随左右的“小伙伴”设计还是很棒的,但实现上就显得非常朴素,加上年岁已高,身上补丁可真不少。

尤其是发现其pom.xml的这段,更感觉其“厚重”:

      <plugin>
        <artifactId>maven-compiler-plugin</artifactId>
        <version>2.1</version>
        <configuration>
          <source>1.3</source>
          <target>1.1</target>
          <encoding>UTF-8</encoding>
        </configuration>
      </plugin>

试想一下,在座几乎没人用JDK1.3了吧,更不用说1.1.

大家知道,按照log4j的说法,他们关心两个东西:性能第一、扩展第二。

其实性能还是OK的,在一般情况下,我们根本就可以忽略不计,考虑到logger.debug("a" + "b" + "c")导致的字符串连接性能,我们完全可以用slf4j作为我们logging的facade,以避免这种性能消耗(没用过就要考虑一下了),或者加上logger.isDebugEnabled()之类的简单判断。

但能不能让log4j跑的“更快”,影响更小呢?

出于好奇+好玩,下面我做了一些有点“无理取闹”的尝试。

我们知道,日志必须根据时间序列进行FIFO的输出,想想java.util.concurrent.BlockingQueue不就是干这个的吗,于是尝试了一下。

思路是:

1、不是真正的写日志,而是把LoggingEvent put到queue里;

2、启用另一个线程去take queue里面的Event,再真正写到我们的文件里去(真正要提高性能,可定运用于生成环境中,没人在生成环境中用ConsoleAppender吧?)。

基于FileAppender编写一个自定义的Appender,我叫BlockingQueueAppender。

代码如下:

package bright.zheng;

import java.util.concurrent.BlockingQueue;
import java.util.concurrent.LinkedBlockingQueue;

import org.apache.log4j.FileAppender;
import org.apache.log4j.Logger;
import org.apache.log4j.spi.LoggingEvent;

/**
 * 
 * @author bright_zheng
 *
 */
public class BlockingQueueAppender extends FileAppender {
	private final BlockingQueue<LoggingEvent> queue;
	private final Thread dispatcher;

	public BlockingQueueAppender() {
		queue = new LinkedBlockingQueue<LoggingEvent>(10000);
		dispatcher = new Thread(new Dispatcher());
		dispatcher.setName("BlockingQueueAppender-" + dispatcher.getName());
		dispatcher.start();
	}

	/**
	 * We don't write to the file directly 
	 * but just put the <code>LoggingEvent</code> to the queue
	 */
	public void append(LoggingEvent event) {
		try {
			queue.put(event);
		} catch (InterruptedException e) {
			//do nothing
		}
	}

	private class Dispatcher implements Runnable {
		public void run() {
			try {
				while (true) {
					LoggingEvent event = queue.take();
					BlockingQueueAppender.this.subAppend(event);
				}
			} catch (InterruptedException ignored) {
				ignored.printStackTrace();
			}
		}
	}
}

然后log4j.properties文件配置成这样:

log4j.rootLogger=ERROR, CONSOLE

log4j.logger.bright.zheng=DEBUG, queue
log4j.additivity.bright.zheng = false

#file
log4j.appender.file=org.apache.log4j.FileAppender
log4j.appender.file.File=File.log
log4j.appender.file.layout=org.apache.log4j.PatternLayout
log4j.appender.file.layout.ConversionPattern=%d{dd MMM yyyy HH:mm:ss,SSS}: %-5p %c: %m%n

#queue
log4j.appender.queue=bright.zheng.BlockingQueueAppender
log4j.appender.queue.File=Queue.log
log4j.appender.queue.layout=org.apache.log4j.PatternLayout
log4j.appender.queue.layout.ConversionPattern=%d{dd MMM yyyy HH:mm:ss,SSS}: %-5p %c: %m%n

之后把上述的queue换成file反复测试,可得到耗时。

测试用例如下(第一个测试用例用来预热,避免创建文件的消耗存在干扰):

package bright.zheng;

import org.apache.log4j.Logger;
import org.junit.Test;

public class ConfigurationEffectiveTest {
	static Logger logger = Logger.getLogger(ConfigurationEffectiveTest.class);
	
	@Test
	public void testLogger(){
		logger.trace("trace");
		logger.debug("debug");
		logger.info("info");
		logger.warn("warn");
		logger.error("error");
		logger.fatal("fatal");		
	}
	
	@Test
	public void testLoggerN(){
		long start = System.currentTimeMillis();
		for(int i=0; i<10000; i++){
			logger.trace("trace");
			logger.debug("debug");
			logger.info("info");
			logger.warn("warn");
			logger.error("error");
			logger.fatal("fatal");		
		}
		long end = System.currentTimeMillis();
		System.out.println("time:" + (end-start));
		logger.fatal("----------END-------------");
	}
}

可想而知,这种扔到queue里就收工的做法,queue的长度当然很重要,故可以设想影响“性能”的指标为queue的大小。

下面是测试数据,我拿excel简单整理如下:

SN FileAppender BlockingQueueAppender queue length

1 922 1109 10

2 937 1094 100

3 938 1047 1000

4 922 1031 2000

5 937 1016 4000

6 922 906 10000

7 906 735 20000

8 953 531 30000

9 938 266 40000

10 907 187 50000  

简单转化为折线图可能看的更清楚些:


很明显,10000个循环,从debug开始算(我设置log的级别为debug),刚好50000个,我直接把queue开成50000个是最快的(好像有点废话,哈哈)

总体感觉真有点无理取闹,但这样做确实可以确保我们包含logger的业务代码省了不少毫秒,而即便开了50000个对象的queue又怎样呢,按照每个LoggingEvent对象不超过0.5k来推算,得考虑给logging花上25M的内存。

是不是值得呢?

猜你喜欢

转载自itstarting.iteye.com/blog/1074710