百度语音转文字乱码 Charset.defaultcharset()

系统环境:Windows7 Tomcat7 JDK1.7

在使用百度语音API时,发现一个问题,通过web发起请求将语音转换为文字时,总是乱码;而在测试单元时,转换成功,不会出现乱码。然后用下面语句输出系统编码

        Properties initProp = new Properties(System.getProperties());
        System.out.println(Charset.defaultCharset());
        System.out.println("当前系统编码:" + initProp.getProperty("file.encoding"));
        System.out.println("当前系统语言:" + initProp.getProperty("user.language"));

web访问输出:

GBK
GBK
zh

测试单元输出:

UTF-8
UTF-8
zh

百度使用的是UTF-8,遂将系统字符集编码改为UTF-8,

System.getProperties().put("file.encoding", "UTF-8");

再次进行web测试,输出:

GBK
UTF-8
zh

当然,转换结果还是乱码

为什么Charset.defaultCharset()输出的编码,这个编码到底是什么编码?

查询结果:

原来 Charset.defaultcharset()指的是jvm输入流、输出流默认使用的编码/解码方式。是虚拟机的默认 charset。所以 我们只需要改变虚拟机的编码为UTF-8即可。

修改方法:

1).JDK修改

修改catalina.bat

添加:

set "JAVA_OPTS=%JAVA_OPTS% %LOGGING_CONFIG% -Dfile.encoding=UTF-8"

2).配置系统环境变量

name: JAVA_TOOL_OPTIONS

value: -Dfile.encoding=UTF-8

 重启IDE,再次运行,字符集编码为UTF-8,转换成功

猜你喜欢

转载自blog.csdn.net/qq_33571718/article/details/85012831