原来的代码:
BufferedReader reader = new BufferedReader(new FileReader(file));
读取utf-8文件时乱码,修改如下:
FileInputStream in = new FileInputStream(file);
BufferedReader reader = new BufferedReader(new InputStreamReader(in,”UTF-8”));
错误解决。
出现问题原因:
问题出在FileReader读取文件的过程中,FileReader继承了InputStreamReader,但并没有实现父类中带字符集参数的构造函数,所以FileReader只能按系统默认的字符集来解码,然后在UTF-8 -> GBK -> UTF-8的过程中编码出现损失,造成结果不能还原最初的字符。
原因明确了,这个问题解决起来并不困难,用InputStreamReader代替FileReader,InputStreamReader isr=new InputStreamReader(new FileInputStream(fileName),”UTF-8”);这样读取文件就会直接用UTF-8解码,不用再做编码转换。