常见JVM参数配置和GC性能优化

常见的JVM参数配置

垃圾回收统计信息

-XX:+PrintGC     打印GC简要信息
-XX:+PrintGCDetails打印GC的详细信息
-XX:+PrintGCTimeStamps打印CG发生的时间戳
-Xloggc:log/gc.log 指定GC log的位置,以文件输出
-XX:+PrintHeapAtGC 每一次GC前和GC后,都打印堆信息。

堆设置

-Xms:初始堆大,最小堆
-Xmx:最大堆大小
-Xmn:设置新生代的大小
-XX:NewRatio新生代和年老代的比值,如为3,表示年轻代与年老代比值为1:3,年轻代占整个年轻代年老代之和的1/4
-XX:SurvivorRatio设置两个Survivor区和eden的比值。注意Survivor区有两个。如:8,表示Eden:Survivor=8:2,一个Survivor区占整个年轻代的1/10
-XX:PermSize:设置永久区的初始空间
-XX:MaxPermSize:设置永久区的最大空间。
-XX:+MaxTenuringThreshold=10:新生代垃圾的最大年龄,代表对象在Survivor区经过10次复制以后才进入老年代。如果设置为0,则年轻代对象不经过Survivor区,直接进入老年代。
-XX:+PretenureSizeThreshold:设置大对象直接进入老年代的阈值。当对象的大小超过这个值时,将直接在老年代分配。 

栈的分配参数

-Xss:设置栈空间的大小

垃圾收集器设置

串行收集器的设置

-XX:+UseSerialGC:设置串行收集器,一般适用于小型应用和单处理器,算法比较简单,GC效率也较高,但可能会给应用带来停顿。

并行回收收集器设置(ParallelGC收集器的目标是达到一个可控制的吞吐量)

-XX:+UseParNewGC:设置年轻代为并行收集。
-XX:+UseParallelGC:设置年轻代使用并行回收收集器。多个线程并行执行GC,一般适用于多处理器系统中,可以提高GC的效率,但算法复杂,系统消耗较大。
-XX:+UseParalledlOldGC:设置老年代为并行回收收集器,Java1.6之后才出现。
-XX:ParallelGCThreads=n:设置并行收集器收集时使用的线程数,最好与CPU数目相等。
-XX:MaxGCPauseMillis=n:设置年轻代每次并行垃圾回收的最大暂停时间。
-XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为1/(1+n)
-XX:+UseAdaptiveSizePolicy:自适应策略,自动选择年轻代区大小和相应的Survivor区比例。

CMS并发收集器(以最短停顿为目标)

-XX:+UseConcMarkSweepGC:使用CMS内存收集。
-XX:+ParallelCMSThreads: 设定 CMS 的线程数量。 
-XX:CMSFullGCsBeforeCompaction:CMS多少次后进行内存压缩,由于并发收集器不对内存空间进行压缩整理,所以运行一段时间以后会产生"碎片",使得运行效率降低。
-XX:+UseCMSCompactAtFullCollection:在FULL GC的时候,对年老代的压缩。CMS是不会移动内存的,因此,这个非常容易产生碎片,导致内存不够用,因此,内存的压缩这个时候就会被启用。可能会影响性能,但是可以消除碎片。
-XX:+CMSInitiatingOccupancyFraction:设置 CMS 收集器在老年代空间被使用多少后触发,默认为 68%。 
-XX:+CMSClassUnloadingEnabled:允许对类元数据进行回收。
-XX:+CMSParallelRemarkEndable:启用并行重标记。 
-XX:CMSInitatingPermOccupancyFraction:当永久区占用率达到这一百分比后,启动 CMS 回收 (前提是-XX:+CMSClassUnloadingEnabled 激活了)。 
-XX:UseCMSInitatingOccupancyOnly:表示只在到达阈值的时候,才进行 CMS 回收。 
-XX:+CMSIncrementalMode:使用增量模式,比较适合单 CPU。 

G1收集器

-XX:+UseG1GC:使用 G1 回收器。 
-XX:+UnlockExperimentalVMOptions:允许使用实验性参数。 
-XX:+MaxGCPauseMills:设置最大垃圾收集停顿时间。 
-XX:+GCPauseIntervalMills:设置停顿间隔时间。 

JVM的GC性能优化

对于GC的性能主要有2个方面的指标:吞吐量(工作时间不算,gc的时间占总的时间比)和暂停时间。

堆大小

默认情况下,vm会增加/减少heap大小以维持free space在整个vm中占的比例,这个比例由MinHeapFreeRatio和MaxHeapFreeRatio指定。

一般而言,server端的app会有以下规则:

(1)对vm分配尽可能多的内存;
(2)将Xms和Xmx设为一样的值。如果虚拟机启动时设置使用的内存比较小,这个时候又需要初始化很多对象,虚拟机就必须重复地增加内存。
(3)处理器核数增加,内存也跟着增大。

年轻代

(1)对于程序流畅性运行影响的因素是新生代的大小。新生代越大,minor collection越少;但是在堆大小固定情况下,新生代越大就意味着越小的老年代,就意味着更多的major collection。
(2)8NewRatio反映的是新生代和老年代的大小比例。NewSize和MaxNewSize反映的是young generation大小的下限和上限,将这两个值设为一样就固定了young generation的大小(同Xms和Xmx设为一样)。
(3)SurvivorRatio也可以优化survivor的大小,不过这对于性能的影响不是很大。SurvivorRatio是Eden和Survior大小比例。

一般而言,server端的app会有以下规则:

(1)首先决定能分配给vm的最大的堆大小,然后设定最佳的young generation的大小;
(2)如果堆大小固定后,增加新生代的大小意味着减小老年代大小。让老年代在任何时候够大,能够容纳所有存活的对象(留10%-20%的空余)。

年轻代大小选择

(1)响应时间优先的应用:尽可能设大,直到接近系统的最低响应时间限制,在此种情况下,年轻代收集发生的频率也是最小的,同时,减少到达年老代的对象。
(2)吞吐量优先的应用:尽可能的设置大,可能到达Gbit的程度,因为对响应时间没有要求,垃圾收集可以并行进行,一般适合8CPU以上的应用。
(3)避免设置过小。当新生代设置过小时会导致:①YGC次数更加频繁;②可能导致YGC对象直接进入旧生代,如果此时旧生代满了,会触发FGC。

老年代大小选择

(1)响应时间优先的应用:年老代使用并发收集器。如果堆设置小了,可以会造成内存碎片、高回收频率以及应用暂停而使用传统的标记清除方式;如果堆大了,则需要较长的收集时间。一般需要参考以下数据:
         并发垃圾收集信息、持久代并发收集次数、传统GC信息、花在年轻代和年老代回收上的时间比例。
(2)吞吐量优先的应用:一般吞吐量优先的应用都有一个很大的年轻代和一个较小的年老代,这样可以尽可能回收掉大部分短期对象,减少中期的对象,而年老代尽存放长期存活对象。

较小堆引起的碎片问题

因为CMS年老代的并发收集器使用标记清除算法所以不会对堆进行压缩当收集器回收时,它会把相邻的空间进行合并,这样可以分配给较大的对象。但是,当堆空间较小时,运行一段时间以后,就会出现"碎片",如果并发收集器找不到足够的空间,那么并发收集器将会停止,可能需要进行如下配置:

-XX:+UseCMSCompactAtFullCollection:使用并发收集器时,开启对年老代的压缩。
-XX:CMSFullGCsBeforeCompaction=0:上面配置开启的情况下,这里设置多少次Full GC后,对年老代进行压缩。

其他说明

(1)用64位操作系统,Linux下64位的jdk比32位jdk要慢一些,但是吃得内存更多,吞吐量更大

(2)XMX和XMS设置一样大,MaxPermSize和MinPermSize设置一样大,这样可以减轻伸缩堆大小带来的压力

(3)CMS的目标是最短的GC停顿时间,使用CMS的好处是用尽量少的新生代,然后老生代利用CMS并行收集,这样能保证系统低延迟的吞吐效率

(4)系统停顿的时候可能是GC的问题也可能是程序的问题,多用jmap和jstack查看,或者killall -3 java,然后查看java控制台日志,能看出很多问题

(5)如果用了缓存,那么年老代应该大一些,缓存的HashMap不应该无限制长,建议采用LRU算法的Map做缓存,LRUMap的最大长度也要根据实际情况设定

(6)采用并发回收时,年轻代小一点,年老代要大,因为年老代用的是并发回收,即使时间长点也不会影响其他程序继续运行,网站不会停顿

(7)JVM参数的设置(特别是 –Xmx –Xms –Xmn -XX:SurvivorRatio  -XX:MaxTenuringThreshold等参数的设置)没有一个固定的公式,需要根据PV old区实际数据、YGC次数等多方面来衡量。为了避免promotion faild可能会导致xmn设置偏小,也意味着YGC的次数会增多,处理并发访问的能力下降等问题。每个参数的调整都需要经过详细的性能测试,才能找到特定应用的最佳配置。

promotion failed:(晋升失败)

垃圾回收时promotion failed,一般可能是两种原因产生,第一个原因是To survivor救助空间不够,救助空间里的对象还不应该被移动到年老代,但年轻代又有很多对象需要放入救助空间;第二个原因是年老代没有足够的空间接纳来自年轻代的对象;这两种情况都会转向Full GC,网站停顿时间较长。

解决方案:

  • 第一个原因解决办法是去掉救助空间,设置-XX:SurvivorRatio=65536 -XX:MaxTenuringThreshold=0即可,但是因为没有用到救助空间,所以年老代容易满,Full GC执行会比较频繁,所以可以把救助空间加大,这样也不会有promotion failed。
  • 第二个原因我的解决办法是设置CMSInitiatingOccupancyFraction为某个值(假设70),这样年老代空间到70%时就开始执行CMS,年老代有足够的空间接纳来自年轻代的对象。

实际编程中的性能优化

下面是一些在实际写程序的过程中应该注意的点:养成这些习惯可以在一定程度上减少内存的无谓消耗,进一步就可以减少因为内存不足导致GC不断。

(1)减少new对象。每次new对象之后,都要开辟新的内存空间。这些对象不被引用之后,还要回收掉。因此,如果最大限度地合理重用对象,或者使用基本数据类型替代对象,都有助于节省内存;
(2)多使用局部变量,减少使用静态变量。局部变量被创建在栈中,存取速度快。静态变量则是在堆内存;
(3)避免使用finalize,该方法会给GC增添很大的负担;
(4)如果是单线程,尽量使用非多线程安全的,因为线程安全来自于同步机制,同步机制会降低性能。例如,单线程程序,能使用HashMap,就不要用HashTable。同理,尽量减少使用synchronized
(5)用移位符号替代乘除号。eg:a*8应该写作a<<3
(6)对于经常反复使用的对象使用缓存;
(7)尽量使用基本类型而不是包装类型,尽量使用一维数组而不是二维数组;
(8)尽量使用final修饰符,final表示不可修改,访问效率高;
(9)单线程情况下(或者是针对于局部变量),字符串尽量使用StringBuilder,比StringBuffer要快;
(10)String为什么慢?因为String 是不可变的对象, 因此在每次对 String 类型进行改变的时候其实都等同于生成了一个新的 String 对象,然后将指针指向新的 String 对象。如果不能保证线程安全,尽量使用StringBuffer来连接字符串。这里需要注意的是,StringBuffer的默认缓存容量是16个字符,如果超过16,apend方法调用私有的expandCapacity()方法,来保证足够的缓存容量。因此,如果可以预设StringBuffer的容量,避免append再去扩展容量。如果可以保证线程安全,就是用StringBuilder。

猜你喜欢

转载自blog.csdn.net/vcit102/article/details/131800172