记一次邮件标题乱码

Java中乱码向来是让人头疼的一件事.原因是其中转码的地方太多了.

jsp 页面,request 参数 ,数据库读取存储, tomcat 设置 ,读取各种文件.这里就不提了.比较常见,网上很多.

邮件标题乱码,为什么标题会乱码,查看一下邮件源码.

我以为是subject 字符集错了,现在很明显是西欧字符集. 于是就设置subject 

BASE64Encoder enc = BASE64Encoder();  
msg.setSubject("=?UTF-8?B?"+enc.encode(subject.getBytes())+"?=");

查看源码

又尝试了 mailMessage.setHtmlEncoding(htmlEncoding); 

解析字符集改了.但是还是乱码.

猜测是不是这个字符本事有问题,想起是不是jvm 默认字符集作祟.于是查看

System.getProperty("file.encoding").   --->ANSI_X3.4-1968

果然就是它.

启动虚拟机的时候如果没有指定应该是系统默认字符集,查看系统字符集

locale -a
C

好吧! 我不知道C是什么? 难道是china???  哈哈!  估计是一个简码.

查看/etc/sysconfig/i18n

cat  /etc/sysconfig/i18n
LANG="zh_CN.UTF-8"

于是

source /etc/sysconfig/i18n

再查看 locale -a 已经是utf-8.

重启jvm.本以为信心满满.结果jvm的字符集还是没变.

做了这么多操作还是无效,真是惹火了我.可能是我理解的不够彻底.难道是加载先后顺序???于是我只能暴力一点了,修改启动jvm的参数

JAVA_OPTS="$JAVA_OPTS -Dfile.encoding=UTF-8"

成功了.

java 中字符集转换有很多.编译 执行期都需要转换.因为java本身是UNICODE.

如果在各种应用场景里就会有更复杂,比如 eclipse,tomcat等等. 需要仔细分析.究竟是那个环节的问题.

猜你喜欢

转载自chongzai.iteye.com/blog/1788903