JVM-StringTable

一、String的基本特性

  • String 字符串,用""引起来表示
    • String s1 = "G1";
    • String s2 = new String("G1");
  • String 生命为final,不可被继承
  • String 实现序列化接口(Serializable)、可排序Conparable<String>、CharSequence
  • jdk1.8 使用char数组进行存储,jdk1.9之后使用byte数组进行存储
    • String堆空间主要部分,用char存储比用byte存储浪费空间
    • StringBuffer、StringBuild都会修改
  • String 不可变的字符序列,不可变性
    • 字面量定义的方式,存储在字符串常量池中,但是在字符串常量池中,不能存在相同的内容,所以String s1="abc"和String s2="abc",使用的是字符串常量池中的相同字符串对象
    • 在一个字符串上拼接,会重新创建,String s1="abc",拼接s1+="def",不是在abc后面拼接而是重新创建一个 abcdef字符串
    • 在现有的字符串修改某个字符,还是会重新创建一个字符串

字符创常量池中不会存储相同内容的字符串

  • String的String pool是一个固定大小的Hashtable,默认长度是1009。如果放进String pool的String非常多,会超出Hash冲突严重,导致链表会很长,而链表长了后直接造成的影响就是调用String.intern时性能下降。
  • 使用-XX:StringTableSize可以设置Stringtable长度
  • 在jdk6以前,StringTable是固定的,就是1009的长度,所以如果常量池中的字符串过多,就会导致效率下降很快。StringTableSize设置没有要求
  • jdk7中,StringTable的默认长度是60013
  • jdk8以后,1009是可设置最小长度

二、String的内存分配

  • java语言中有8中基本数据类型和一种比较特殊的类型String。这些类型为了使他们在运行过程中速度更快、更节省内存,都提供了一种常量池的概念
  • 常量池就是类似于一个JAVA系统级别的缓存。8中数据类型常量池都是系统协调的,String类型的常量池比较特殊,主要方法有2中
    • 直接使用双引号声明出来的String对象会直接存储在常量池中
    • 其他方式使用Stirng的intern方法。
  • jdk6方法在永久代、jdk7之后放在堆中
    • 永久代很小
    • GC不频繁

三、String的基本操作

  • java语言要求,完全相同的字符串字面量,应该包含相同Unicode字符序列,并且必须指向相同String类实例

四、字符串拼接操作

  • 常量与常量的拼接结果在常量池,原理是编译期优化
  • 常量池中不会存在相同内容的常量
  • 只要其中有一个是遍历,结果就在队中。变量拼接的原理是StringBuilder
  • 如果拼接的结果调用intern()方法,则主动将常量池中还没有的字符串对象放入池中,并返回对象地址
  • StringBuilder效率高的原因,String的变量拼接都会创建StringBuilder,在实际开发过程中,尽量使用定义StringBuilder的长度

五、intern()的使用

常量池存在返回引用,不存在创建字符串并返回引用。s1.intern()==s2.intern()等价于s1.equals(s2),initern 确保一个字符只有一个在常量池中。

new String("ab")会创建几个对象:2个,一个new对象在堆中,一个ab在常量池中

 new String("a") + new String("b")会创建几个对象:

  • 因为拼接操作 StringBuilder 第一个
  • new String("a") 第二个
  • a 第三个
  • new String("b") 第四个
  • b 第五个
  • 最后拼接的 toString 中new String("ab") 第六个,但是在字符串常量池中没有生成ab

JDK7以后:字符串放在堆里面,当调用intern方法的时候,发现堆中存在 new String("11"),常量池中直接存放 new String("11")的引用,主要是节省空间

String.intern() 使用总结:

  • 在jdk1.6中
    • 如果常量池中存在,则不会放入,返回已有对象的地址
    • 如果不存在,会把对象复制一份,放入常量池,并放回对象地址
  • 在jdk1.7中
    • 如果常量池中存在,则不会放入,返回已有对象的地址
    • 如果不存在,会把对象的引用复制一份,放入常量池,并放回对象地址

其实主要是要看,常量池中保存的是对象的引用还是字符串对象。 

六、StringTable的垃圾回收

String.intern()空间使用效率:使用它更节省内存空间。相差3倍左右。

七、G1中的String去重操作(非常量池,是堆中的String)

测试结果:

  • 堆存活数据集合里面String约占25%
  • 堆存活数据集合里面重复的String对象月有13.5%
  • String 平均长度是45

根据以上数据,G1垃圾或受其自动持续的对重复String对象进行去重,避免内存浪费。

猜你喜欢

转载自blog.csdn.net/liming0025/article/details/121663337
今日推荐