JVM 字符编码转换

JVM中字符都以UTF-16的编码方式存在,即在代码中定义的所有变量和数据,在JVM中都是按照UTF-16进行编码。然而,JVM只是Java的虚拟机,所有数据最终还是要通过操作系统存储在内存中。所以,JVM和操作系统之间会进行编码转换。如果使用的是中文的Windows操作系统,那么JVM就会将字符转换成GBK的编码方式传输给操作系统进行存储。

JVM对数据的读取与写入操作分成两种类型,一种是以字符形式进行读写(Reader和Writer),另一种是以字节流进行读写(InputStream和OutputStream)。其中,面向字节的读写,不存在编码转换的问题,因为它是保证系统中的文件二进制内容和读入JVM内部的二进制内容要一致,即只要保证数据的0、1顺序不变就行;对于面向字符的方式,是要保证系统中的存放的内容和读入JVM内部的内容要一致,即读入的字符为“我”, 那么在系统中存放的内容也得是“我”。但是系统的编码方式和JVM的编码方式不同,所以两者之间需要进行编码转换。在Java中,完成编码转换的工作由InputSteamReader和OutputStreamWriter类完成。这两个类是字符流和字节流之间的适配器,用户选择不同的编码进行读取和写入。

比如:new OutputStreamWriter(new FileOutputStream("文件路径"),"UTF-8"),就是以UTF-8的编码方式写入硬盘中。

猜你喜欢

转载自qu66q.iteye.com/blog/2259662
今日推荐