乱码问题理解

1、pageEncoding="UTF-8"的作用是设置JSP编译成Servlet时使用的编码。
2、contentType="text/html;charset=UTF-8"的作用是指定对服务器响应进行重新编码的编码。
3、request.setCharacterEncoding(“UTF-8”)的作用是设置对客户端请求进行重新编码的编码。
4、response.setCharacterEncoding(“UTF-8”)的作用是指定对服务器响应进行重新编码的编码。
response.setCharacterEncoding(“UTF-8”)的作用是指定对服务器响应进行重新编码的编码。同时,浏览器也是根据这个参数来对其接收到的数据进行重新编码(或者称为解码)。所以在无论你在JSP中设置response.setCharacterEncoding (“UTF-8”)或者response.setCharacterEncoding(“GBK”),浏览器均能正确显示中文(前提是你发送到浏览器的数据编码是正确的,比如正确设置了pageEncoding参数等)。

对于发送数据,服务器按照response.setCharacterEncoding—contentType—pageEncoding的优先顺序,对要发送的数据进行编码。

对于接收数据,要分三种情况。一种是浏览器直接用URL提交的数据,另外两种是用表单的GET和POST方式提交的数据。

对于表单中POST方式提交的数据,只要在接收数据的JSP中正确request.setCharacterEncoding参数,即将对客户端请求进行重新编码的编码设置成浏览器编码,就可以保证得到的参数编码正确。有写读者可能会问,那如何得到浏览器编码呢?上面我们提过了,在默认请情况下,浏览器编码就是你在响应该请求的JSP页面中response.setCharacterEncoding设置的值。所以对于POST表单提交的数据,在获得数据的JSP页面中request.setCharacterEncoding要和生成提交该表单的JSP页面的 response.setCharacterEncoding设置成相同的值。

对于URL提交的数据和表单中GET方式提交的数据,在接收数据的JSP中设置request.setCharacterEncoding参数是不行的,因为在Tomcat5.0中,默认情况下使用ISO- 8859-1对URL提交的数据和表单中GET方式提交的数据进行重新编码(解码),而不使用该参数对URL提交的数据和表单中GET方式提交的数据进行重新编码(解码)。要解决该问题,应该在Tomcat的配置文件的Connector标签中设置useBodyEncodingForURI或者 URIEncoding属性,其中useBodyEncodingForURI参数表示是否用request.setCharacterEncoding 参数对URL提交的数据和表单中GET方式提交的数据进行重新编码,在默认情况下,该参数为false(Tomcat4.0中该参数默认为true); URIEncoding参数指定对所有GET方式请求(包括URL提交的数据和表单中GET方式提交的数据)进行统一的重新编码(解码)的编码。 URIEncoding和useBodyEncodingForURI区别是,URIEncoding是对所有GET方式的请求的数据进行统一的重新编码(解码),而useBodyEncodingForURI则是根据响应该请求的页面的request.setCharacterEncoding参数对数据进行的重新编码(解码),不同的页面可以有不同的重新编码(解码)的编码。所以对于URL提交的数据和表单中GET方式提交的数据,可以修改 URIEncoding参数为浏览器编码或者修改useBodyEncodingForURI为true,并且在获得数据的JSP页面中 request.setCharacterEncoding参数设置成浏览器编码。

package day08;

import java.io.IOException;

import javax.servlet.ServletException;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
/*

  • 案例【content-type】-- 服务器发送给浏览器的数据类型和数据编码格式

  • @author Administrator
    */
    public class ResponseDemo04 extends HttpServlet {

    private static final long serialVersionUID = -1839403652123389047L;

    public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
    request.setCharacterEncoding(“utf-8”);
    response.setContentType(“text/html;charset=utf-8”);
    /*
    * response.setContentType(“text/html;charset=utf-8”);
    * 等于
    * response.setHeader(“content-type”, “text/html”);
    * response.setCharacterEncoding(“utf-8”);
    * 两句
    *
    *
    * 但是response.setContentType(“text/html;charset=utf-8”);
    * 中的charset有比setEncoding多一个作用:
    * 不仅能设置输出数据的编码;还能告诉浏览器自适应当前的编码
    /
    // 所有这种set的前面的引号内的都是需要设置的头的名字name,后面是需要设置的新的值value
    response.setHeader(“content-type”, “text/html;charset=utf-8”);
    // 等价于上面的setContentType(“text/html;charset=utf-8”);
    /

    * setContentType中的text/html意思就是将我的内容按照html的格式去读出来
    * 我们也可以通过response的getWriter去输出写出特定的html的格式
    */

     /*
      * 因为xml和html本源都是相同的,所以这里设置浏览器的解析的格式的时候
      * 也可以设置使用xml的
      */
     response.setContentType("text/xml;charset=utf-8");
     /*
      * 注意:一定要写服务器支持的数据类型,如果写服务器不支持的类型,就会报错
      * 
      * text/html
      * text/xml
      * image/gif
      * image/jpg
      * 等等
      */
     response.getWriter().write("<html><head><title>this is a title</title></head><body>this is a body</body></html>");
    

    }
    public void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
    request.setCharacterEncoding(“utf-8”);
    response.setContentType(“text/html;charset=utf-8”);
    }

}

猜你喜欢

转载自blog.csdn.net/wcc178399/article/details/83719832