JDK9 String优化

1.char[] -> byte[]

private final char value[];

在JDK9之前String底层使用的是char数组来存储的,Java中一个char占用2byte。
然而对于英文字符、数字等标准字符实际上只用1Byte就足够了,所以旧的String实现在存储包含这些字符的字符串时,在这些字符上浪费了一倍的内存空间。

private final byte value[];

从JDK9开始String底层改用了byte数组来做底层存储,每个元素只占一byte,其粒度更细了,就避免了在以上常规字符存储上的空间浪费。

2.增加coder字段

JDK9增加 coder字段,该属性为编码的标识符,用于区分拉丁字符与非拉丁字符。

private final byte coder;

static final byte LATIN1=0;
static final byte UTF16=1;

3.字符串长度计算

对于拉丁字符串,直接取数组长度就是字符串的长度。但非拉丁字符要占用2byte,那字符串长度怎么计算呢?

可以通过将value.length右移coder计算(在JDK8时是没有右移操作,直接返回value.length的)

public int length(){
    return value.length >> coder();
}

对于LATIN1,右移0,相当于没变。

对于UTF16,右移1,相当于除以2。两个字节代表一个汉字,所以除以2是字符串长度。

猜你喜欢

转载自blog.csdn.net/Ahuuua/article/details/124184733