Java中文异常——全解

1、字符集不匹配

如果在处理中文字符时出现乱码或无法正确显示的情况,很可能是由于字符集不匹配导致的。Java中常用的字符集是UTF-8和GBK,确保输入、输出和存储的字符集一致。

2、文件编码问题

在读取或写入文件时,需要指定正确的字符集。可以使用InputStreamReader和OutputStreamWriter来指定字符集,例如:UTF-8类型的读取

读取的时候由于编码不统一造成乱码。

只需要同步编码类型即可。

import java.io.*;
public class Test {
    public static void main(String[] args) {

        FileInputStream fis = null;
        try {
            fis = new FileInputStream("D:\\save\\study\\javaStu\\APIDemos\\src\\main\\java\\file.txt");
            InputStreamReader isr = new InputStreamReader(fis, "UTF-8");
            BufferedReader br = new BufferedReader(isr);
            String line = null;
            while((line = br.readLine())!=null){
                System.out.println(line);
            }
            br.close();
        } catch (FileNotFoundException | UnsupportedEncodingException e) {
            throw new RuntimeException(e);
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }
}

这里用的是绝对路径,如果相对路径建议使用反射的方式读取文件。

import org.springframework.util.ResourceUtils;

String path = new File(ResourceUtils.getURL("classpath:").getPath().toString()).getAbsolutePath();

有了这个路径再去寻找指定文件就靠谱了。

3、字符串编码转换

如果需要对字符串进行编码转换,可以使用String的getBytes和构造函数来指定字符集

import java.io.UnsupportedEncodingException;

public class Test {
    public static void main(String[] args) {
        String str = "中文";
        byte[] utf8Bytes = new byte[0];
        try {
            utf8Bytes = str.getBytes("UTF-8");
            String gbkStr = new String(utf8Bytes, "GBK");
            System.out.println(gbkStr);
        } catch (UnsupportedEncodingException e) {
            throw new RuntimeException(e);
        }
    }
}

正确操作

4、URL编码问题

在处理URL时,需要对其中的中文字符进行编码。可以使用java.net.URLEncoder来进行URL编码。

import java.io.UnsupportedEncodingException;
import java.net.URLDecoder;
import java.net.URLEncoder;

public class Test {
    public static void main(String[] args) {
        try {
            String url = "http://example.com?userName=中文";
            String encodedUrl = URLEncoder.encode(url, "UTF-8");
            String decodeUrl = URLDecoder.decode(encodedUrl, "UTF-8");
            System.out.println(encodedUrl);
            System.out.println(decodeUrl);
        } catch (UnsupportedEncodingException e) {
            throw new RuntimeException(e);
        }
    }
}

有两个包操作

import java.net.URLDecoder;
import java.net.URLEncoder;

5、数据库编码问题

在与数据库交互时,需要确保数据库连接和表的字符集设置正确。可以在连接字符串中指定字符集。

String url = "jdbc:mysql://localhost/mydb?useUnicode=true&characterEncoding=UTF-8";

示例: 

jdbc:mysql://rm-bp1zq3879r28p726lco.mysql.rds.aliyuncs.com:3306/test?characterEncoding=utf8

6、HttpServletRequest中文过滤

在JavaWeb中,可以使用过滤器(Filter)来对请求中的中文进行过滤处理。过滤器是在Servlet容器中用来拦截请求和响应的组件,可以对请求进行修改、增强或者验证等操作。

要实现对请求中的中文进行过滤,可以按照以下步骤进行操作:

创建一个过滤器类,实现javax.servlet.Filter接口,并重写doFilter方法。

import javax.servlet.*;
import javax.servlet.http.HttpServletRequest;
import java.io.IOException;

public class ChineseFilter implements Filter {
    @Override
    public void init(FilterConfig filterConfig) throws ServletException {
        // 初始化操作,如果有需要可以在这里进行
    }

    @Override
    public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain)
            throws IOException, ServletException {
        HttpServletRequest httpRequest = (HttpServletRequest) request;
        String method = httpRequest.getMethod();

        // 只对POST请求进行处理,可以根据需要修改
        if ("POST".equals(method)) {
            request.setCharacterEncoding("UTF-8");
        }

        // 继续执行过滤链
        chain.doFilter(request, response);
    }

    @Override
    public void destroy() {
        // 销毁操作,如果有需要可以在这里进行
    }
}

在web.xml配置文件中配置过滤器和过滤器映射。

<filter>
    <filter-name>ChineseFilter</filter-name>
    <filter-class>com.example.ChineseFilter</filter-class>
</filter>

<filter-mapping>
    <filter-name>ChineseFilter</filter-name>
    <url-pattern>/*</url-pattern>
</filter-mapping>

上述代码中,com.example.ChineseFilter需要替换为你实际的过滤器类的完整路径。

这样配置后,过滤器会拦截所有的请求,并对POST请求中的中文参数进行UTF-8编码处理,确保正确处理中文字符。

猜你喜欢

转载自blog.csdn.net/feng8403000/article/details/132003824