字符流和字节流的区别
拿一下上一篇文章的例子:
public static void main(String[] args) throws Exception
{
File file = new File("D:/writer.txt");
Writer out = new FileWriter(file);
// 声明一个String类型对象
String str = "Hello World!!!";
out.write(str);
out.close();
// 读文件操作
Reader in = new FileReader(file);
// 开辟一个空间用于接收文件读进来的数据
char c0[] = new char[1024];
int i = 0;
// 将c0的引用传递到read()方法之中,同时此方法返回读入数据的个数
i = in.read(c0);
in.close();
if (-1 == i)
{
System.out.println("文件中无数据");
}
else
{
System.out.println(new String(c0, 0, i));
}
}
第8行"out.close()"注释掉可以看一下效果,"writer.txt"一定是空的,控制台上输出的是"文件中无数据",说明一下原因。
字符流和字节流非常相似,但也有区别,从网上找了一张图:
、
从图上看,字符流和字节流最大的区别在于,字节流在操作时本身不会用到缓冲区(内存),是文件本身直接操作的,而字符流操作时使用了缓冲区,通过缓冲区再操作文件。这也解释了上面程序的那个问题,为什么不对资源进行close()就无法写入文件的原因。因为在关闭字符流时会强制性地将缓冲区中的内容进行输出,但是如果没有关闭,缓冲区中的内容是无法输出的。
什么是缓冲区?简单理解,缓冲区就是一块特殊的内存区域。为什么要使用缓冲区?因为如果一个程序频繁操作一个资源(文件或数据库),则性能会很低,为了提升性能,就可以将一部分数据暂时读入到内存的一块区域之中,以后直接从此区域读取数据即可,因为读取内存的速度要快于读取磁盘中文件内容的速度。
在字符流的操作中,所有的字符都是在内存中形成的,在输出前会将所有的内容暂时保存在内存之中,所以使用了缓冲区。
如果不想在关闭时再输出字符流的内容也行,使用Writer的flush()方法就可以了。
字符流的原理
Java支持字符流和字节流,字符流本身就是一种特殊的字节流,之所以要专门有字符流,是因为Java中有大量对于字符的操作,所以专门有字符流。字节流和字符流的转换是以InputStreamReader和OutputStreamWriter为媒介的,InputStreamReader(字节解码到字符)可以将一个字节流中的字节解码成字符,OutputStreamWriter(字符编码到字节)可以将写入的字符编码成自节后写入一个字节流。
InputStreamReader中的解码字节,是由StreamDecoder完成的,StreamDecoder是Reader的子类,定义在InputStreamReader的开头:
public class InputStreamReader extends Reader {
private final StreamDecoder sd;
同样,OutputStreadWriter中的编码字节,是由StreamEncoder完成的,StreamEncoder是Writer的子类,定义在OutputStreamWriter的开头:
public class OutputStreamWriter extends Writer {
private final StreamEncoder se;
假如不对StreamDecoder和StreamEncoder指定Charset编码格式,将使用本地环境中的默认字符集,例如中文环境中将使用GBK编码。
InputStreamReader有两个主要的构造函数:
1、InputStreamReader(InputStream in)
2、InputStreamReader(InputStream in, String charsetName)
OutputStreamWriter也有两个主要的构造函数:
1、OutputStreamWriter(OutputStream out)
2、OutputStreamWriter(OutputStream out, String charsetName)
从构造函数就可以看出,字符流是利用字节流实现的。InputStreamReader和OutputStreamWriter的两个构造函数的区别在于,一个是使用的默认字符集,一个可以指定字符集名称。其实FileReader和FileWriter可以看一下源码,很简单,只有构造函数,里面都是分别根据传入的文件绝对路径或者传入的File实例,new出FileInputStream和FileOutputStream,再调用InputStreamReader和OutputStreamWriter的构造方法。这么做,帮助开发者省去了实例化FileInputStream和FileOutputStream的过程,让开发者可以直接以fileName或file作为构造函数的参数。
BufferedWriter、BufferedReader
为了达到最高的效率,避免频繁地进行字符与字节之间的相互转换,最好不要直接使用FileReader和FileWriter这两个类进行读写,而使用BufferedWriter包装OutputStreamWriter,使用BufferedReader包装InputStreamReader。同样,在D盘下没有"buffered"这个文件,代码示例为:
public static void main(String[] args) throws Exception
{
File file = new File("D:/buffered.txt");
Writer writer = new FileWriter(file);
BufferedWriter bw = new BufferedWriter(writer);
bw.write("1234\n");
bw.write("2345\n");
bw.write("3456\n");
bw.write("\n");
bw.write("4567\n");
bw.close();
writer.close();
if (file.exists() && file.getName().endsWith(".txt"))
{
Reader reader = new FileReader(file);
BufferedReader br = new BufferedReader(reader);
String str = null;
while ((str = br.readLine())!= null)
{
System.out.println(str);
}
reader.close();
br.close();
}
}
运行一下,首先D盘下多出了"buffered.txt"这个文件,文件中的内容为:
然后看一下控制台的输出结果:
1234 2345 3456 4567
没什么问题,输出了文件中的内容。注意两点:
1、利用BufferedWriter进行写操作,写入的内容会放在缓冲区内,直到遇到close()、flush()的时候才会将内容一次性写入文件。另外注意close()的顺序,一定要先关闭BufferedWriter,再关闭Writer,不可以倒过来,因为BufferedWriter的写操作是通过Writer的write方法写的,如果先关闭Writer的话,就无法将缓冲区内的数据写入文件了,会抛出异常
2、利用BufferedReader进行读操作,不可以用父类Reader指向它,因为readLine()这个方法是BufferedReader独有的,readLine()的作用是逐行读取文件中的内容
补充:
首先说明下字节流和字符流:
FileReader,FileWriter 是读字符的,1个字符是2个字节,16位
OutputStream ,InputStream是读字节的,1个字节是8位
如果要读汉字,一个汉字是2个字节,用InputStream读就把汉字折成两半,不太适合吧。
字符流主要读文本效率比较高。
字节流主要读二进制文件,图片 ,音频,视频等,就是为了防止出现读取的单位放大,出现无法还原本程序的目的
如果把文件按字节读取,然后按照UTF-8的格式编码显示,怎么办?
InputStreamReader(将字节编码成字符)就有这功能,对原字节再编码的过程。
下面切入正题:
转换流:InputStreamReader和OutputStreamWriter
一。InputStreamReader 是字符流Reader的子类,是字节流通向字符流的桥梁。你可以在构造器重指定编码的方式,如果不指定的话将采用底层操作系统的默认编码方式,例如 GBK 等
要启用从字节到字符的有效转换,可以提前从底层流读取更多的字节,使其超过满足当前读取操作所需的字节。
为了达到最高效率,可要考虑在 BufferedReader 内包装 InputStreamReader。例如:
BufferedReader in = new BufferedReader(new InputStreamReader(System.in));
二。OutputStreamWriter 是字符流Writer的子类,是字符流通向字节流的桥梁。
每次调用 write() 方法都会导致在给定字符(或字符集)上调用编码转换器。在写入底层输出流之前,得到的这些字节将在缓冲区中累积
为了获得最高效率,可考虑将 OutputStreamWriter 包装到 BufferedWriter 中,以避免频繁调用转换器。例如:
BufferedWriter out = new BufferedWriter(new OutputStreamWriter(System.out));
(1)Reader和Writer类(文本字符流读写类):提供的对字符流处理的类,它们为抽象类。一般通过其子类来实现。
(2)InputStreamReader(InputStream in) 和OutputStreamWriter(OutputStream out):它们可以使用指定的编码规范并基于字节流生成对应的字符流。
(3)BufferedReader(InputStreamReader isr, int size) 和 BufferedWriter(OutputStreamWriter osr, int size):
为提高字符流的处理效率,可以采用缓冲机制的流实现对字符流作成批的处理,避免了频繁的从物理设备中读取信息 。
public static void main(String[] args) {
try {
//1.从文件中获得读入字节到字节输入流
FileInputStream fis = new FileInputStream("D:/01.txt");
//2. 为FileInputStream加上字符处理功能(字节通向字符的桥梁 InputStreamReader)
InputStreamReader isr = new InputStreamReader(fis);
//3.为了达到最高效率,可考虑在 BufferedReader内包装 InputStreamReader 避免频繁转换
BufferedReader bufr = new BufferedReader(isr);
//4.创建将数据写出到文本文件的文件输出流
FileOutputStream fos = new FileOutputStream("D:/02.txt");
//5.为FileOutputStream加上字符处理功能(字符通向字节桥梁 OutPutStreamWriter)
OutputStreamWriter osw = new OutputStreamWriter(fos);
//6.为了提高效率可考虑在BufferWriter内包装 OutputStreamWriter 避免频繁转换
BufferedWriter bufw = new BufferedWriter(osw);
//简易写法
BufferedReader bufr = new BufferedReader(new InputStreamReader(new FileInputStream("D:/01.txt")));
BufferedWriter bufw = new BufferedWriter(new OutputStreamWriter(new FileOutputStream("D:/02.txt")));
// FileReader
int ch =0;
//以字符方式显示文件内容
while ((ch = bufr.read()) !=-1 ){
System.out.print((char)ch);
bufw.write(ch);
}
if(bufr != null){
bufr.close();
}if(bufw != null){
bufw.close();
}
} catch (Exception e) {
e.printStackTrace();
}
}