Java如何识别并读取不同编码的文本文件 - 代码天地

Java如何识别并读取不同编码的文本文件

企业开发 2018-05-10 00:00:16 阅读次数: 3

相信大部分人都知道,txt文件有四种编码格式,"GBK", "UTF-8", "Unicode", "UTF-16BE",每一种编码格式的区分在于写入文件头的信息不同.为了避免读取乱码的现象,我们应该在读取文本之前先读取文件头信息,以便做出正确的读取编码方式.下面给出方法.
/**
* 判断文件的编码格式
* @param fileName :file
* @return 文件编码格式
* @throws Exception
*/
public static String codeString(String fileName) throws Exception{
BufferedInputStream bin = new BufferedInputStream(
new FileInputStream(fileName));
int p = (bin.read() <<

+ bin.read();
String code = null;

switch (p) {
case 0xefbb:
code = "UTF-8";
break;
case 0xfffe:
code = "Unicode";
break;
case 0xfeff:
code = "UTF-16BE";
break;
default:
code = "GBK";
}

return code;
}
然后,以字符流的方式读取文本
FileInputStream fInputStream = new FileInputStream(file);
//code为上面方法里返回的编码方式
InputStreamReader inputStreamReader = new InputStreamReader(fInputStream, code);
BufferedReader in = new BufferedReader(inputStreamReader);

String strTmp = "";
//按行读取
while (( strTmp = in.readLine()) != null) {
sBuffer.append(strTmp + "/n");
}
return sBuffer.toString();

猜你喜欢

转载自xiaowei-qi-epro-com-cn.iteye.com/blog/1927866

Java如何识别并读取不同编码的文本文件

读取不同编码格式文本文件

Java判断文本文件编码格式以及读取

Java获取文本文件编码

java之文本文件读取

Java nio读取文本文件

Java文本文件读取

java读取文本文件内容

fgetws和fread读取不同编码文本文件时的结果

用python转换不同编码的文本文件

文本文件编码

读取文本文件

java读取默认编码是ansi的文本文件时，解决中文乱码问题

java自动识别用户上传的文本文件编码

Java中文本文件的读取(按行读取)

如何用VFP判断文本文件的编码格式？

java判断文本文件编码格式

java 读取网络ZipInputStream 中 Zipentry 文本文件

java读取文本文件中的内容

JAVA——读取文本文件内容（字节）

JAVA——读取文本文件内容（行）

Java文本文件的按行读取

读取文本文件内容（Java FileChannel）

java读取中文文本文件乱码问题

Java读取文本文件中文乱码问题

检测文本文件的编码

判断文本文件的编码

js 读取文本文件

机器学习：文本文件读取

Julia: 1.0读取文本文件

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)