pageEncoding和charset 编码的区别和联系

我们在写jsp文件的时候回习惯性的加上这样的语句:

<%@ page contentType="text/html;charset=UTF-8"  pageEncoding="utf-8"   language="java" %>

发现 “UTF-8”出现了两遍,那么charset 与 pageEncording有什么区别于联系呢?

pageEncoding是jsp文件本身的编码。如在myeclipse下默认jsp页采用ISO-8859-1,当在页面中输入中文字符保存时,无法保存。

contentType的charset是指服务器发送给客户端时的内容编码。

了解下jsp从被请求到响应经历的三个阶段:

第一阶段:将jsp编译成Servlet(.java)文件。用到的指令是pageEncoding,根据pageEncoding=“XXX”的指示,找到编码的规则为“XXX”,服务器在将JSP文件编译成.java文件时会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8编码的JAVA源码(即.java)。


第二阶段:从Servlet文件(.java)到Java字节码文件(.class),从UTF-8到UTF-8。在这一阶段中,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。JAVAC用UTF-8的encoding读取java源码,编译成UTF-8编码的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。这一过程是由JVM的内在规范决定的,不受外界控制。


第三阶段:从服务器到浏览器,这在一过程中用到的指令是contentType。服务器载入和执行由第二阶段生成出来JAVA二进制码,输出的结果,也就是在客户端可见到的结果,在这次输出过程中,由contentType属性中的charset来指定,将UTF8形式的二进制码以charset的编码形式来输出。如果没有人为设定,则默认的是ISO-8859-1的形式。

从以上过程可知:

pageEncoding  :说明jsp内容的编码。

contentType:设置JSP源文件和响应正文的字符集编码及MIME类型,  contentType的charset是指服务器发送给客户端时的内容编码。

发布了64 篇原创文章 · 获赞 47 · 访问量 9552

猜你喜欢

转载自blog.csdn.net/weixin_42194284/article/details/99702987