String 浅析学习

一、string 属性

/** The value is used for character storage. */ 
直译:该值用于字符存储,故:string底层是由数组实现的
private final char value[];
/** Cache the hash code for the string */
直译:缓存字符串的哈希代码。故:這個涉及到 == 和 eques 比較
private int hash; // Default to 0
/**
 * Class String is special cased within the Serialization Stream Protocol.
 *
 * A String instance is written into an ObjectOutputStream according to
 * <a href="{@docRoot}/../platform/serialization/spec/output.html">
 * Object Serialization Specification, Section 6.2, "Stream Elements"</a>
 */
直译:序列化作用
private static final ObjectStreamField[] serialPersistentFields =
    new ObjectStreamField[0];

可序列化类中可序列化字段的描述。数组

用于声明类的可序列化字段。

二、不可变问题

注:
final 关键字表示对象是最终形态的,对象是不可改变的。
final 应用于类、方法和变量时意义是不同的,但本质是一样的:final 表示不可改变。
final 用在变量的前面表示变量的值不可以改变,此时该变量可以被称为常量。
final 用在方法的前面表示方法不可以被重写
final 用在类的前面表示类不可以被继承,即该类是最终形态。

String 被final修饰,所以Strng不能被继承,由于String是由数组构成,并且属性value被final也不能修改,一旦初始化之后就不会改变。

三、构造:例 

// 线程安全
public String(StringBuffer buffer) {
    synchronized(buffer) {
        this.value = Arrays.copyOf(buffer.getValue(), buffer.length());
    }
}

StringBuffer insert、append,及大多方法是由synchronized关键字修饰的,StringBuffer的父类AbstractStringBuilder

是一个抽象类实现了: Appendable, CharSequence

StringBuffer的insert和append直接使用的是父类的,并且父类根据参数类型不同分别重载了append方法,

 

 

 由此可见stringbuffer插入和append在业务处理上是基本一致的。

四:string常用方法

public int length() {return value.length;} 
// 通过数组属性获取长度。
public boolean isEmpty() {return value.length == 0;} 
// 调用该方法的时候一定要校验是否为null,否则会NPE

//例: a.equals(anObject)
public boolean equals(Object anObject) {
    // 先对数值进行比较,如果一致则返回true
    if (this == anObject) {
        return true;
    }
    // 校验比较对象是否是String类型,否则直接返回false,类型都不一致,就没必要继续匹配了
    if (anObject instanceof String) {
        // 强转,类型一致
        String anotherString = (String)anObject;
        // a的长度
        int n = value.length;
        // 如果类型一致,长度不一致,则没必要继续匹配,直接返回false
        if (n == anotherString.value.length) {
            char v1[] = value;
            char v2[] = anotherString.value;
            int i = 0;
            // 循环比较如果匹配过程中有一个元素不一致,则判定不成立,返回false
            while (n-- != 0) {
                if (v1[i] != v2[i])
                    return false;
                i++;
            }
            return true;
        }
    }
    return false;
}
// 测试此字符串的子字符串是否从指定的索引以指定的前缀开头。
public boolean startsWith(String prefix, int toffset) {
    char ta[] = value;
    int to = toffset;
    char pa[] = prefix.value;
    int po = 0;
    int pc = prefix.value.length;
    // Note: toffset might be near -1>>>1.
    if ((toffset < 0) || (toffset > value.length - pc)) {
        return false;
    }
    while (--pc >= 0) {
        if (ta[to++] != pa[po++]) {
            return false;
        }
    }
    return true;
}

这是我们常用的配备前缀或者判断是否以指定字符开头的方法,所以可以直接指定开始索引,更直接

 

以指定字符串结束,还是通过startsWith方法来处理, 

 空字符串的哈希值为零,如果数组有值,则循环计算哈希码值

String str= "abcd";  // 此时value[] = {'a','b','c','d'}  因此

for循环会执行4次

第一次:h = 31*0 + a = 97 

第二次:h = 31*97 + b = 3105 

第三次:h = 31*3105 + c = 96354 

第四次:h = 31*96354 + d = 2987074 

以上代码可以算出 str的hashcode = 2987074  

可以使用System.err.println(new String("abcd").hashCode()); 进行验证

// 返回此字符串中第一次出现指定的字符,从指定索引开始搜索。
public int indexOf(int ch, int fromIndex) {
    // 数据校验,设置索引,所以可以看出是从0开始
    final int max = value.length;
    if (fromIndex < 0) {
        fromIndex = 0;
    // 如果目标索引大于当前字符最大长度,那么目标字符肯定不会出现在当前字符中,所以返回不包含
    } else if (fromIndex >= max) {
        // Note: fromIndex might be near -1>>>1.
        return -1;
    }
    // Character.MIN_SUPPLEMENTARY_CODE_POINT,
    // 补充码位。U+10000和U+10FFFF之间的Unicode码位。
    if (ch < Character.MIN_SUPPLEMENTARY_CODE_POINT) {
        // handle most cases here (ch is a BMP code point or a
        // negative value (invalid code point))
        final char[] value = this.value;
        for (int i = fromIndex; i < max; i++) {
            if (value[i] == ch) {
                return i;
            }
        }
        return -1;
    } else {
        return indexOfSupplementary(ch, fromIndex);
    }
}

循环匹配返回索引,否则

private int indexOfSupplementary(int ch, int fromIndex) {
     //  确定指定的代码点是否是一个有效的Unicode代码点值。
    if (Character.isValidCodePoint(ch)) {
        final char[] value = this.value;
        final char hi = Character.highSurrogate(ch);
        final char lo = Character.lowSurrogate(ch);
        final int max = value.length - 1;
        for (int i = fromIndex; i < max; i++) {
            if (value[i] == hi && value[i + 1] == lo) {
                return i;
            }
        }
    }
    return -1;
}

 判断包含系列基本都是使用indexOf方法

 lastIndexOf系列方法主要是使用这个静态方法

static int lastIndexOf(char[] source, int sourceOffset, int sourceCount,
        char[] target, int targetOffset, int targetCount,
        int fromIndex) {
    /*
     * Check arguments; return immediately where possible. For
     * consistency, don't check for null str.
     */
    int rightIndex = sourceCount - targetCount;
    if (fromIndex < 0) {
        return -1;
    }
    if (fromIndex > rightIndex) {
        fromIndex = rightIndex;
    }
    /* Empty string always matches. */
    if (targetCount == 0) {
        return fromIndex;
    }

    int strLastIndex = targetOffset + targetCount - 1;
    char strLastChar = target[strLastIndex];
    int min = sourceOffset + targetCount - 1;
    int i = min + fromIndex;

startSearchForLastChar:
    while (true) {
        while (i >= min && source[i] != strLastChar) {
            i--;
        }
        if (i < min) {
            return -1;
        }
        int j = i - 1;
        int start = j - (targetCount - 1);
        int k = strLastIndex - 1;

        while (j > start) {
            if (source[j--] != target[k--]) {
                i--;
                continue startSearchForLastChar;
            }
        }
        return start - sourceOffset + 1;
    }
}

 这个通过指定索引开始截取,可以看出两个字符串下标越界校验处理,最后返回当前字符串或重新新创建一个索引开始到结束的字符串,new String(value,beginIndex,subLen) 实现如下

通过数组copy方法 

数组Arrays

 最后使用的系统数组copy,返回了一个新的数组,没有更改原始数据

指定开始结束,只是业务处理中多了一步校验

 替换,最后也是返回了一个新的字符串

 全替换,和指定替换有点不一样,这个是把当前字符作为正则进行处

 

 

 // 分割源码
public String[] split(String regex, int limit) {
    /* fastpath if the regex is a
     (1)one-char String and this character is not one of the
        RegEx's meta characters ".$|()[{^?*+\\", or
     (2)two-char String and the first char is the backslash and
        the second is not the ascii digit or ascii letter.
     */
      // 正则校验
    char ch = 0;
    if (((regex.value.length == 1 &&
         ".$|()[{^?*+\\".indexOf(ch = regex.charAt(0)) == -1) ||
         (regex.length() == 2 &&
          regex.charAt(0) == '\\' &&
          (((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 &&
          ((ch-'a')|('z'-ch)) < 0 &&
          ((ch-'A')|('Z'-ch)) < 0)) &&
        (ch < Character.MIN_HIGH_SURROGATE ||
         ch > Character.MAX_LOW_SURROGATE))
    {
        int off = 0;
        int next = 0;
        boolean limited = limit > 0;
        ArrayList<String> list = new ArrayList<>();
        while ((next = indexOf(ch, off)) != -1) {
            if (!limited || list.size() < limit - 1) {
                list.add(substring(off, next));
                off = next + 1;
            } else {    // last one
                //assert (list.size() == limit - 1);
                list.add(substring(off, value.length));
                off = value.length;
                break;
            }
        }
        // If no match was found, return this
        if (off == 0)
            return new String[]{this};

        // Add remaining segment
        if (!limited || list.size() < limit)
            list.add(substring(off, value.length));

        // Construct result
        int resultSize = list.size();
        if (limit == 0) {
            while (resultSize > 0 && list.get(resultSize - 1).length() == 0) {
                resultSize--;
            }
        }
        String[] result = new String[resultSize];
        return list.subList(0, resultSize).toArray(result);
    }
    return Pattern.compile(regex).split(this, limit);
}

 整体还是通过循环、截取、拼接最后组合成一个数组然后返回

 

valueOf方法最终还是,创建了一个新的数组,所以只要通过valueOf方法处理的String 都是会在堆内存中创建一个对象的,和 new String(); 同理,如果只是引用 String str = “123”,则只是在栈内存中,

简单说明堆栈:

        GC方式:栈自动释放,堆需要GC

        空间:栈比堆小

        分配方式:栈支持静态和动态分配,堆仅支持动态分配

        效率:栈的效率比堆高

学习记录第一天,加油!!!

猜你喜欢

转载自blog.csdn.net/wdz985721191/article/details/118926825