java web项目各种乱码的解决方案

原创作品,允许转载,转载时请务必以超链接形式标明文章  原始出处 、作者信息和本人声明。否则将追究法律责任。
作者: 永恒の_☆ 地址: http://blog.csdn.net/chenghui0317/article/details/10299103

一、前言

    目前web项目中,很多乱码情况没有得到统一解决,或多或少影响开发效率和延长开发时间, 所以总结一下关于java web项目各种乱码情况的解决方案。


二、准备条件

     1、一个普通的web项目 webProject;

     2、一个web服务器 Tomcat。


三、分析各种乱码的情况

     1、项目的编码格式和页面文件的编码格式不一样是否有冲突?

      答:webProject项目的编码格式是“GBK” ,项目下的页面中的编码格式是“UTF-8”,实践发现,项目的编码格式和页面的编码格式不一样不会有任何问题,显示的中文没有乱码。    

     查看项目的编码格式可以在 项目-->右键-->Properties--> Text file encoding 框内显示的具体值就是项目编码格式。 

     查看页面文件的编码格式可以在 页面-->右键-->Properties--> Text file encoding 框内显示的具体值就是页面文件的编码格式。


     2、页面的文件编码格式和页面内容的编码格式不一样是否有冲突?

      答:<1>将页面文件编码格式改为“UTF-8”,页面的内容的编码格式改为“GBK”,具体如下:

[html]  view plain  copy
  1. <%@ page language="java" contentType="text/html; charset=GBK" pageEncoding="GBK"%>  
  2. <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">  
  3. <html>  
  4. <head>  
  5. <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">  
  6. <title>Insert title here</title>  
  7. </head>  
  8. <body>  
  9. 测试中文是否乱码!@#!@#  
  10. </body>  
  11. </html>  
结果发现 乱码了,具体效果如下:


所以页面的文件的编码格式必须和页面内容的编码格式一样,否则显示肯定乱码。

     <2>另外,如果页面中格式在eclipse显示 是好的,这个时候改变文件的编码格式也会乱码,如果非要改变文件编码的格式,可以这样: 先将显示正确的内容复制一份 然后修改文件的编码格式,这个时候文件内显示的是乱码,然后将复制的内容直接覆盖在这个页面中就好了。


     <3>如果给将上面代码的pageEncoding改为"UTF-8"了发现显示正常了,所以可不可以这么说,页面显示是否乱码与charset指定的值无关?


     <4>但是如果将上面代码的pageEncoding="UTF-8“这个属性直接去掉,然后显示效果,发现乱码了。 如果把contentType属性的值改为 contentType="text/html; charset=UTF-8" 试试效果,具体如下:


所以可以这么理解:在没有指定pageEncoding属性的时候, charset 将会被忽略,如果没有指定pageEncoding属性,那么页面就会按照charset的编码值来显示具体效果。


     <5>如果charset指定的值是GBK ,这个时候由于没有pageEncoding 所以页面内容按照GBk编码显示,但是与文件编码格式不符合 ,索引导致乱码。具体效果如下:

     <6>现在又有另外一种情况,如果pageEncoding指定了UTF-8 ,但是charset指定的是 GBK ,GB2312  这个时候页面显示不会乱码。


     <7>但是如果charset指定的是iso-8859-1,这个时候页面显示就是乱码了,具体效果如下:


     <8>但是如果charset指定的是big5,这个是页面显示只是部分乱码,具体效果如下:

所以BIG5只会会繁体或者没有繁体格式的文字敏感。


     <9>现在再实验一下,把contentType属相也去掉,指定meta标签中content属性中的charset=UTF-8 ,具体效果如下:

一种另外格式的乱码显示出来了。。。


综上所述:在jsp中如果要显示正确的内容,并且保证其显示不乱码,必须要指定contentType 或者 pageEncoding 的属性与文件编码格式一致。并且如果他们都存在,那么pageEncoding必须与文件编码格式一致,contentType必须是中文编码格式才行。


    3、通过URL传递中文参数的时候接收的乱码怎么解决?

     答:<1>新建一个servlet 名叫encodeServlet,在encode.jsp中添加超链接传递一个参数  跳转到该serlvet。

超链接如下:

[html]  view plain  copy
  1. <a href="servlet/encodeServlet?param=中文">go to servlet</a>  

servlet接收参数,具体get方法处理方式如下:

[java]  view plain  copy
  1.     /** 
  2.      * @see HttpServlet#doGet(HttpServletRequest request, HttpServletResponse response) 
  3.      */  
  4.     protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {  
  5.         String param = request.getParameter("param");  
  6.           
  7.         request.getRequestDispatcher("../encode.jsp?param="+param).forward(request, response);  
  8.     }  
调试之后发现,参数乱码了:


     <2>这是因为参数通过url传递的时候是以http超文本协议传递的,它的格式是 iso-8859-1 ,所以可以设置tomcat服务器全局URL请求的格式,这样子所有的请求都会按照这个编码格式传递参数了。具体如下:

在tomcat安装目录的conf/server.xml中找到protocol="HTTP/1.1"的属性配置的连接器,在里面添加URIEncoding属性,具体如下:

<Connector URIEncoding="UTF-8" connectionTimeout="20000" port="8080" protocol="HTTP/1.1" redirectPort="8443"/>

URIEncoding ,顾名思义,它只针对 URL传递的请求,即get请求。。


     <3>并且如果这么设置之后就不能再使用 param = new String(param.getBytes("iso-8859-1"),"UTF-8");转码了  这样反而又变乱码了。


     <4>另外还可以在接收到参数之后,重新指定编码也可以,具体如下:

[java]  view plain  copy
  1. String param = request.getParameter("param");  
  2. param = new String(param.getBytes("iso-8859-1"),"UTF-8");  

调试页面,发现并没有成功,具体效果如下:

没有效果,,,为什么,?因为页面的内容编码是UTF-8的,但是URL它传递的时候只能传递iso-8859-1 的编码,如果直接传递UTF-8编码的内容,那么无论后台怎么转换都没有效果。 即使在servlet中重新指定charset 也无济于事。


     <5>但是如果直接在地址栏输入: http://localhost:8080/webProject/servlet/encodeServlet?param=中文

并且修改一些代码,具体修改如下:

[java]  view plain  copy
  1. response.setContentType("text/html;charset=UTF-8");  
  2. String param = request.getParameter("param");  
  3. param = new String(param.getBytes("iso-8859-1"),"UTF-8");  

然后运行效果如下:


这样子是没问题的。。


     <6>但是如果非要使用new String()重新编码来实现接收中文怎么办呢?,可以修改源码,具体如下:

[java]  view plain  copy
  1. request.setCharacterEncoding("UTF-8");  
  2. String param = request.getParameter("param");  
  3. param = new String(param.getBytes("iso-8859-1"),"UTF-8");  
设置字符编码格式 即可,具体效果如下:



实践证明,不管是超链接 跳转到servlet 还是直接在url输入中文跳转到servlet 只使用request.setCharacterEncoding("UTF-8"); 统一编码格式 都可以实现接收正确的参数。。

最开始一直以为request.setCharacterEncoding("UTF-8"); 只能处理post请求的参数,get请求的一样可以。


     <7>既然这么有效果,那么为了避免重复的使用这行代码或者忘记使用而导致乱码,可以使用一个过滤器 统一处理任何请求的编码格式。一劳永逸。

具体FIlter代码如下:

[java]  view plain  copy
  1. package com.struts2.util;  
  2.   
  3. import java.io.IOException;  
  4.   
  5. import javax.servlet.Filter;  
  6. import javax.servlet.FilterChain;  
  7. import javax.servlet.FilterConfig;  
  8. import javax.servlet.ServletException;  
  9. import javax.servlet.ServletRequest;  
  10. import javax.servlet.ServletResponse;  
  11.   
  12. import org.apache.log4j.Logger;  
  13.   
  14. public class CharacterFilter implements Filter {  
  15.   
  16.     private Logger logger = Logger.getLogger(this.getClass());  
  17.     String encoding = null;  
  18.     @Override  
  19.     public void destroy() {  
  20.         logger.info("***************the CharacterFilter class' destroy() is invoking .***************");  
  21.     }  
  22.   
  23.     @Override  
  24.     public void doFilter(ServletRequest request, ServletResponse response,  
  25.             FilterChain filterChain) throws IOException, ServletException {  
  26.         request.setCharacterEncoding(encoding);  
  27.         response.setCharacterEncoding(encoding);  
  28.         filterChain.doFilter(request, response);  
  29.     }  
  30.   
  31.     @Override  
  32.     public void init(FilterConfig filterConfig) throws ServletException {  
  33.         logger.info("***************the CharacterFilter class' init() is invoking .***************");  
  34.         encoding = filterConfig.getInitParameter("encoding");  
  35.     }  
  36.   
  37. }  

然后web.xml的配置如下:

[html]  view plain  copy
  1. <filter>  
  2.   <filter-name>characterFitler</filter-name>  
  3.   <filter-class>com.struts2.util.CharacterFilter</filter-class>  
  4.   <init-param>  
  5.     <param-name>encoding</param-name>  
  6.     <param-value>UTF-8</param-value>  
  7.   </init-param>  
  8. </filter>  
  9. <filter-mapping>  
  10.   <filter-name>characterFitler</filter-name>  
  11.   <url-pattern>/*</url-pattern>  
  12. </filter-mapping>  

     <8>但是但是,实际开发中,上面的配置在处理get请求的时候 有些时候可以指定编码成功,有的时候指定编码失败, 成功率大概60-70%之间,至今不知道为何会这样。。。

解决方案:

使用js函数编码之后,然后后台解码即可,具体前台代码如下:

[html]  view plain  copy
  1. <%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>  
  2. <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">  
  3. <html>  
  4. <head>  
  5. <title>Insert title here</title>  
  6. </head>  
  7. <body>  
  8. 测试中文是否乱码!@#!@#<br/>  
  9. <a href="javascript:goTo()">go to servlet</a>  
  10. <script>  
  11. function goTo(){  
  12.     var param = encodeURI(encodeURI("中文"));  //这里编码必须调用两次,因为传递后台后java程序会解码一次,然后自己还要解码一次,  
  13.     location.href="<%=request.getContextPath()%>/servlet/encodeServlet?param="+param;  
  14. }  
  15. </script>  
  16. </body>  
  17. </html>  
后台解码代码如下:

[java]  view plain  copy
  1. //request.setCharacterEncoding("UTF-8");  
  2. //response.setContentType("text/html;charset=UTF-8");  
  3. String param = request.getParameter("param");  
  4. //param = new String(param.getBytes("iso-8859-1"),"UTF-8");//这个用于直接处理转换get请求的编码  
  5. //param = URLEncoder.encode(param);//这个是用于编码的方法  
  6. param = URLDecoder.decode(param);//这个是用于解码的方法  

ok ,这样子解决了js函数请求后台出现乱码的情况。


     <9>另外在利用PrintWriter输出的时候 出现乱码了,具体代码如下:

[java]  view plain  copy
  1. PrintWriter out = response.getWriter();  
  2. out.print("接收的参数是:"+param);  
  3.   
  4. out.close();  
具体效果如下所示:


这里可以在servlet请求的顶部加上response.setContentType("text/html;charset=UTF-8"); 设置内容编码格式 即可输出正确的效果,具体如下图:


综上所述:

(1)在参数的时候出现乱码,如果是get请求可以统一设置tomcat的uri编码处理格式,这样所有的url发送的请求都是以指定格式发送。

(2)request.setCharacterEncoding("UTF-8");主要用户 get/post请求中设置整个servlet的编码格式,好处是防止传递的中文参数乱码。

(3)response.setContentType("text/html;charset=UTF-8"); 主要用于指定当前请求中的内容格式,好处是防止输出内容的时候防止中文乱码。

(4)如果在处理中文乱码中以上方法都解决不了,那就要使用js前段编码两次,后台解码的方式处理。


    4、是否有其他框架的配置直接解决中文乱码情况?

     <1>如果项目中使用了struts2 ,可以在sturts.xml中配置一个常量,指定所有post请求的编码,具体如下:

[html]  view plain  copy
  1. <constant name="struts.i18n.encoding" value="UTF-8"></constant>  


     <2>如果在项目中使用了spring,可以在web.xml中配置一个过滤器也可以解决编码乱码的问题,具体如下:

[html]  view plain  copy
  1. <filter>  
  2.   <filter-name>encodingFilter</filter-name>  
  3.   <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>  
  4.   <init-param>  
  5.     <param-name>encoding</param-name>  
  6.     <param-value>UTF-8</param-value>  
  7.   </init-param>  
  8.   <init-param>  
  9.     <param-name>forceEncoding</param-name>  
  10.     <param-value>true</param-value>  
  11.   </init-param>  
  12. </filter>  
  13. <filter-mapping>  
  14.   <filter-name>encodingFilter</filter-name>  
  15.   <url-pattern>/*</url-pattern>  
  16. </filter-mapping>  

猜你喜欢

转载自blog.csdn.net/qq_39691226/article/details/80364621