Java String类的分析

1.String的特殊性

1.1对象的创建

public class Test {
	public static void main(String[] args) {
		String str1 = new String("abcd");
		String str2 = "abcd";
	}
}

1.1.1下面解释对象创建过程:

Java 对String 类的特殊管理:

>Java的每一个类都有一个常量池,这个常量池定义在class文件中有描述(javap -v 类的全类名),包括值、标识符(举个例子:String a ="astr";int b = 1;这些代码中的 标识符a,b和值 “astr” 都是常量池的内容,而1 则会嵌入的操作指令中)、属性名、类名、方法名等。
>每个JVM实例同时会在方法区维持一个String pool,在装载每个类时的会解析类的常量池,先在javaheap内创建这些这些常量对象返回其引用然后=》将这些字符串常量的引用存储到String pool中=》最后将这些引用给每个类的常量池。
> ==是比较地址,String 类重写了 equals()方法,比较对象内容(比较的是底层的char[] 内每一个字符是否相等)
> 个人猜测:string pool中存的是引用值而不是具体的实例对象,具体的实例对象是在堆中开辟的一块空间存放的。但是怎么验证还没有教好的思路。

1.1.1.1 String str1 = "abcd"的创建过程:

实现过程:

    >首先栈区创建str1引用,然后在String池中寻找指向的内容为"abcd"的对象的引用,如果String池中没有,则javaheap创建一个对象返回引用到String Pool,最后返回指向String池中的引用赋值给str1;如果有,则直接返回引用赋值给str1;

推论及验证:

    >如果后来又定义了字符串变量 str2 = "abcd",则直接将str2引用指向String池中已经存在的“abcd”,不再重新创建对象;这时str1==str2。

但是需要注意的一点是::

    >Java 语言提供了 字符串连接符号("+")以及将其他对象转换为字符串的特殊支持。
        >字符串连接 底层是通过 StringBuilder(或 StringBuffer)类及其 append 方法实现的(jjava heap创建buffer或者builder对象,然后append返回);
        >字符串转换是通过 toString 方法实现的,该方法由 Object 类定义,并可被 Java 中的所有类继承。

注意点的验证:

        >如果内容为"abc"的str2进行了字符串的"+"连接str2 = str2+"d";此时str2指向的是在堆中新建的内容为"abcd"的对象,即此时进行str1==str2,返回值false,因为地址不一样。

1.1.1.2 String str = new String("abcd")的创建过程:

实现过程:

>直接在堆中创建对象返回引用。如果后来又有String str3 = new String("abcd"),str3不会指向String pool里面的对象,而是在堆中重新创建一个对象并指向它。

验证方式:

>如果此时进行str2==str3以及str1 == str3 均会返回false,因为两个对象的地址不一样,如果是str2.equals(str3),返回true,因为内容相同。

注意的一点:

>str.intern()这个方法就是将str指向的String对象内容,存储一份到String pool里并返回在String pool里的“引用”;

1.2String对象的不可性(immutable)

1.2.1 为什么设计为final的?

因为String类的创建销毁等涉及到JVM的机制,一般程序员不具备这个能力。

1.2.2我们无法利用String提供的API来改变原对象的内容

public class Base {

	public static void main(String[] args) {
		String str1 = new String("abcd");
		String str2 = "abcd";
		String str3 = "abcd";
		String str4 = new String("abc") + "d";// 连接 请勿直接使用 "abc"+"d" 会被编译器有化成  "abcd"

		System.out.println(str2 == str1);// false
		System.out.println(str2 == str3);// true
		System.out.println(str2 == str4);// false
		System.out.println(str2 == str1.intern() && str2 == str3.intern() && str2 == str4.intern());// true 都是String pool里面的引用

		String str5 = str1.replace("a", "z");// 替换字符
		System.out.println(str1);
		System.out.println(str5);

		String str6 = str1.substring(2);// 截取字符
		System.out.println(str1);
		System.out.println(str6);

		String str7 = str1.toLowerCase();// 转小写
		System.out.println(str1);
		System.out.println(str7);

		String str8 = str1.toUpperCase();// 转大写
		System.out.println(str1);
		System.out.println(str8);

		String str9 = str1.trim();// 去除两端空格字符
		System.out.println(str1);
		System.out.println(str9);
	}

}

如以上等等的方法均未改变str1的值及其指向String对象的值。因为所有的API 相关的操作都是对底层的char[] value进行deepcopy后进行的操作

1.2.3 但是反射可以做到

public class Test {
	public static void main(String[] args) throws NoSuchFieldException, SecurityException, IllegalArgumentException, IllegalAccessException {
		String str1 = new String("abcd");
		//here is an way to change str1
		Class clazz = str1.getClass();
		Field valueField = clazz.getDeclaredField("value");
		valueField.setAccessible(true);
		char [] str1Changed = new char[]{'z','x','c','v'};
		valueField.set(str1, str1Changed);
		System.out.println(str1);//zxcv
	}
}

这是利用反射修改str1指向对象的内容

1.2.4不可变对象的优势

1 天生的线程安全性(只能读取不能修改)
2 在性能上的提升(可缓存,不必每次都要申请内存初始化等从而提升性能)

2.关于字符及编码及乱码

String:"字符"串,这个字符就是我们人通常理解的抽象的符号(例如"a","b","中"等),但是在计算机是无法存储这种抽象的符号(只能存储数值),只能依靠数值与符号的映射关系(编码字符集)来解决数值和符号的对应关系然后显示字符。 计算机上很常见的显示乱码一般有下面几个原因:

第一个字节序列本身有问题(文件破坏掉了,这个情况较少,而且基本无解);
第二个就是我们解码的方式不对(这种常见,本身是UTF-8格式编码的,我们却以GBK的形式解码,修改解码方式),
第三个就是我们缺少对应的显示方法(这种也常见,文件是UTF-8的我们以UTF-8解码,但是其中某些字码对应国外的文字符号,我们缺少显示方法,解决方法为安装缺少对应字符集),

参考如下代码:

public class Test {
	public static void main(String[] args) throws UnsupportedEncodingException {
		String str = "wo是中国人";//默认编码格式UTF-8
		byte [] gbkbytes = str.getBytes("GBK");//进行GBK编码
		byte [] utf8bytes = str.getBytes("UTF-8");//进行UTF-8编码
		System.out.println(gbkbytes.length);
		assert gbkbytes.length == 10;//1英2中
		System.out.println(utf8bytes.length);
		assert utf8bytes.length == 14;//1英三中
		//对gbkbytes 进行 UTF8解码
		System.out.println(new String(gbkbytes, "UTF-8"));//wo���й�
		//对utf8bytes 进行GBK解码
		System.out.println(new String(gbkbytes, "GBK"));//wo是中国人
	}
	
}

猜你喜欢

转载自my.oschina.net/Aruforce/blog/1615428