复杂的东西从来不讨人喜欢。处理内存泄露、线程死锁和GC调优这些问题在过去是很痛苦的。
这三种问题所带来的性能问题是最难重现的,可能带来的是无休息的bug修复。
尽管性能调优需要很好的洞察力,下面是LinkedIn工程师用来实现高吞吐量和低延迟的GC配置
选项:
-server -Xms40g -Xmx40g -XX:MaxDirectMemorySize=4096m -XX:PermSize=256m -XX:MaxPermSize=256m -XX:NewSize=6g -XX:MaxNewSize=6g -XX:+UseParNewGC -XX:MaxTenuringThreshold=2 -XX:SurvivorRatio=8 -XX:+UnlockDiagnosticVMOptions -XX:ParGCCardsPerStrideChunk=32768 -XX:+UseConcMarkSweepGC -XX:CMSParallelRemarkEnabled -XX:+ParallelRefProcEnabled -XX:+CMSClassUnloadingEnabled -XX:CMSInitiatingOccupancyFraction=80 -XX:+UseCMSInitiatingOccupancyOnly -XX:+AlwaysPreTouch -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -XX:+PrintTenuringDistribution -XX:+PrintGCApplicationStoppedTime -XX:-OmitStackTraceInFastThrow
在获取这目前来说最佳配置的过程中,LinkedLin的工程师们肯定也也经历过下面相似的过程:
复杂的东西从来不讨人喜欢。处理内存泄露、线程死锁和GC调优这些问题在过去是很痛苦的。
这三种问题所带来的性能问题是最难重现的,可能带来的是无休息的bug修复。
尽管性能调优需要很好的洞察力,下面是LinkedIn工程师用来实现高吞吐量和低延迟的GC配置
选项:
1.收集环境信息。在进行调优之前,你需要明白当前的问题是什么,在特殊情况下,表现为
长时间和频繁的GC停顿,也其实只是死锁和内存泄露造成的。或者其他相关的情况。但是我们
假设你选对了调优的地方。
2.下一步,你需要收集关于GC停顿的信息。-XX:+PrintGCDetails -XX:+PrintGCTimeStamps可以
获取GC停顿的信息。
3.现在,需要分析这个信息,但是如果你没有这方面的经验的话,还是不鼓励你去阅读几百页的
GC文件
但是我们假设你能在日志文件中找到问题所在。你就必须搞清楚在什么情况下需要使用CMS或者G1收集器
(新生代配置-XX:+UseParNewGC,老年代配置-XX:+UseConcMarkSweepGC),并且理解清楚伊甸园区和存活区的
比例关系以便很好的设置他们的空间大小(-XX:NewSize=6g -XX:MaxNewSize=6g -XX:MaxTenuringThreshold=2 -XX:SurvivorRatio=8)。
到现在其实才刚开始 -- 还有很多可以使用的调优选项,比如优化堆碎片甚至处理系统的大页交换功能,还有
-XX:ParGCCardsPerStrideChunk配置选项。
各虚拟机版本支持的选项有很多,不一一列出,可以针对具体问题查询相应版本的选项设置