【Java中编码和字符转换的问题】(待完善)

1、编码问题(Get\POST)

① html页面:浏览器会根据<http header:content-type=text/html;  charset=”UTF-8”>的值来决定用什么encoding(编码),离线的本地html要在meta中指定,不指定会采用默认的编码<meta http-equiv=”Content-Type” content=”text/html”; charset=”UTF-8”>。

② Request :request.setCharacterEncoding(“UTF-8”)应用于通过getParameter()获取字符串,只对POST有效。必须设置在servlet中getParameter()方法被调用之前,原因是:只有在第一次调用getParameter()方法时会查询encoding编码格式,后续的getParameter将不再查询编码格式。

 对于GET提交,get提交的内容存在URL中,需在Tomcat的server.xml设置,在Connector标签中设置生成URI时的编码格式 URIEncoding=”UTF-8”。(个人理解为 针对URI这一特殊类型数据,在server中统一设置编码格式,不管是在JSP还是Servlet中出现,都使用统一的解码方式,避免了乱码的发生)。默认为ISO8859-1。

③ Resopnse :response.setContentType(“text/html”;charset=”UTF-8”)是指定HTTP响应的编码,同时指定浏览器(JSP)的显示编码,显示编码不一定在JSP中有效果,因为JSP中设置的编码格式优先级更高。

response.setCharacterEncoding(“UTF-8”)的作用是设置HTTP的响应编码,设置应在getWriter和response被提交之前。(个人理解为 此编码的设置是针对要返回的数据进行编码生成response,再返回)。

④ JSP:<%@page ContentType=”text/html;charset=UTF-8”%>

<%@page pageEncoding=”charset=UTF-8”%>

以上两种编码只有一种有效,用于设置 页面的显示编码。

如果页面中使用include标签导入了其他的JSP,<%@ include file=”BB.jsp”%>设置的BB.jsp中不能再设置编码,<jsp:include page=”BB.jsp”/>设置,BB.jsp中还可以设置编码集。

 

 

 

对于URL和URI的区别。请看:https://www.cnblogs.com/hust-ghtao/p/4724885.html

 


 

 

5、字符转换===>网络中传输的是字节数组,String编码成字节数组,收到后解码显示

   字符流 = 字节流 + 编码集

 1)GBK编码字节流到UTF-8编码字节流的转换:dst=new String(src,”GBK”).getBytes(“UTF-8”);

  new String(src,”GBK”):将一个字节数组编码成一个String。===> 字符串具有

  str.getBytes(“UTF-8”): 将一个string解码成一个数组数组。 ===>  编码格式

2)将ISO-8859-1字符串转换成GB2312编码:

 new String(“ISO-8859-1”.getBytes(“ISO-8859-1”),”GB2312”); 字符串==>字节数组==>字符串

 

 

String UTF-8str = new String(oldGBKStr.getBytes(“GBK”),”UTF-8”);

字符串解码成字符数组,字节数组编码成字符串。

 

实际的编码国际化常用手段利用ResourceBundler类,根据Local的不同,选择性选取与Local对应后缀的Properties文件。

 

猜你喜欢

转载自blog.csdn.net/ca1m0921/article/details/80945046