GC调优:其实没有那么难

复杂的东西从来不讨人喜欢。处理内存泄露、线程死锁和GC调优这些问题在过去是很痛苦的。

这三种问题所带来的性能问题是最难重现的,可能带来的是无休息的bug修复。

尽管性能调优需要很好的洞察力,下面是LinkedIn工程师用来实现高吞吐量和低延迟的GC配置

选项:

-server -Xms40g -Xmx40g -XX:MaxDirectMemorySize=4096m -XX:PermSize=256m -XX:MaxPermSize=256m 
-XX:NewSize=6g -XX:MaxNewSize=6g -XX:+UseParNewGC -XX:MaxTenuringThreshold=2 
-XX:SurvivorRatio=8 -XX:+UnlockDiagnosticVMOptions -XX:ParGCCardsPerStrideChunk=32768 
-XX:+UseConcMarkSweepGC -XX:CMSParallelRemarkEnabled -XX:+ParallelRefProcEnabled 
-XX:+CMSClassUnloadingEnabled  -XX:CMSInitiatingOccupancyFraction=80 -XX:+UseCMSInitiatingOccupancyOnly 
-XX:+AlwaysPreTouch -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps 
-XX:+PrintTenuringDistribution -XX:+PrintGCApplicationStoppedTime -XX:-OmitStackTraceInFastThrow

在获取这目前来说最佳配置的过程中,LinkedLin的工程师们肯定也也经历过下面相似的过程:

复杂的东西从来不讨人喜欢。处理内存泄露、线程死锁和GC调优这些问题在过去是很痛苦的。

这三种问题所带来的性能问题是最难重现的,可能带来的是无休息的bug修复。

尽管性能调优需要很好的洞察力,下面是LinkedIn工程师用来实现高吞吐量和低延迟的GC配置

选项:

  1.收集环境信息。在进行调优之前,你需要明白当前的问题是什么,在特殊情况下,表现为

  长时间和频繁的GC停顿,也其实只是死锁和内存泄露造成的。或者其他相关的情况。但是我们

  假设你选对了调优的地方。

  2.下一步,你需要收集关于GC停顿的信息。-XX:+PrintGCDetails -XX:+PrintGCTimeStamps可以

  获取GC停顿的信息。

  3.现在,需要分析这个信息,但是如果你没有这方面的经验的话,还是不鼓励你去阅读几百页的

  GC文件

但是我们假设你能在日志文件中找到问题所在。你就必须搞清楚在什么情况下需要使用CMS或者G1收集器

(新生代配置-XX:+UseParNewGC,老年代配置-XX:+UseConcMarkSweepGC),并且理解清楚伊甸园区和存活区的

比例关系以便很好的设置他们的空间大小(-XX:NewSize=6g -XX:MaxNewSize=6g -XX:MaxTenuringThreshold=2 -XX:SurvivorRatio=8)。

到现在其实才刚开始 -- 还有很多可以使用的调优选项,比如优化堆碎片甚至处理系统的大页交换功能,还有

-XX:ParGCCardsPerStrideChunk配置选项。

各虚拟机版本支持的选项有很多,不一一列出,可以针对具体问题查询相应版本的选项设置

猜你喜欢

转载自clearity.iteye.com/blog/2050354