request、response 中文乱码问题与解决方式

request乱码指的是:浏览器向服务器发送的请求参数中包含中文字符,服务器获取到的请求参数的值是乱码;

response乱码指的是:服务器向浏览器发送的数据包含中文字符,浏览器中显示的是乱码;
 
乱码产生的原因:不管是request乱码还是response乱码,其实都是由于客户端(浏览器)跟服务器端采用的编码格式不一致造成的。以request乱码为例:浏览器向服务器发送请求,因为浏览器与服务器之间的通信实质上是socket流,所以要先将请求参数(字符)转换成字节,也就是编码过程,服务器接收到请求参数后进行解码(字节转字符),然后封装到request对象中。如果客户端的编码与服务器端的解码不统一,就会导致通过request获取到的请求参数的值是乱码。
 
解决:
一、response乱码
服务器发给浏览器的数据默认按照ISO-8859-1编码,浏览器接收到数据后按照默认的字符集进行解码后显示,如果浏览器的默认解码字符集不是ISO-8859-1,就出现乱码。对于response乱码,只需要在服务器端指定一个编码字符集,然后通知浏览器按照这个字符集进行解码就可以了。有三种方式:

A、设置服务器端的编码
response.setContentType("text/html");
response.setCharacterEncoding("utf-8”);
B、通知浏览器服务器发送的数据格式
response.setContentType("text/html;charset=utf-8”);
C、浏览器使用utf-8进行解码

 注: A、B两种方法必须在response.getWriter()或response被提交之前进行设置,二者会相互覆盖,设置一种即可。

response.setContentType()的作用是使客户端浏览器,区分不同种类的数据,
并根据不 同的MIME调用浏览器内不同的程序嵌入模块来处理相应的数据。 
例如:web浏览器就是通过MIME类型来判断文件是GIF图片,通过MIME类型来处理json字符串。 
Tomcat的安装目录\conf\web.xml 中就定义了大量MIME类型 ,可以参考。 
response.setContentType(“text/html; charset=utf-8”); html 
response.setContentType(“text/plain; charset=utf-8”); 文本 
response.setContentType(“text/ JavaScript ; charset=utf-8”); json数据 
response.setContentType(“application/xml; charset=utf-8”); xml数据

二、request乱码
从浏览器发起的访问方式有三种:在地址栏直接输入URL访问、点击页面中的超链接访问、提交表单访问。
第一种访问方式浏览器默认将参数按照utf-8进行编码,后面两种访问方式浏览器将参数按照当前页面的显示编码进行编码。所以对于request乱码,只需要在服务器端设置相应的解码格式即可。由于访问方式不同,浏览器对参数的编码格式也不同,为了方便处理,通过超链接和表单的访问也规定必须是utf-8格式,即显示当前页面的编码也要使用utf-8,这样浏览器将统一使用utf-8对参数进行编码。

A、post方式
post方式属于表单提交,参数存在于请求体中。
request.setCharacterEncoding("utf-8”)

B、get方式
get方式提交的参数会跟在请求行中的uri后边,服务器按照默认的iso-8859-1进行解码,这时候解决乱码有两种办法:
办法一:修改服务器端对uri参数的默认编码
在tomcat的server.xml中,设置元素的属性URIEncoding="UTF-8”即可。(默认没有设置此属性)

例如: 
1、设置元素的属性useBodyEncodingForURI=“true”,意思是请求体和uri使用相同的编码格式。通过设置这两个属性,既可以解决get方式的乱码,又可以解决     post方式的乱码。
2、通过修改server.xml指定服务器对get和post统一按照utf-8解码,要求tomcat管理下的所有web应用都要使用utf-8编码,即所有的jsp、html页面都使用utf-8编码。

Request乱码特例:

一个JSP页面已经设置UTF-8编码,而且使用response.sendRedirect重定向到此JSP页面时,页面中文显示正常,并不会出现乱码。
但是在Servlet中使用request.getRequestDispatcher请求转发到这个页面,页面显示时中文乱码,不知道什么原因。

现在有两种解决办法:
一、在Servlet的get或post方法中使用response.setCharacterEncoding("UTF-8");

二、在Servlet的get或post方法中把getWriter()方法注释掉就没有乱码了
//PrintWriter out = response.getWriter();

猜你喜欢

转载自blog.csdn.net/w47_csdn/article/details/71739109