(IO深入操作)字符编码

在计算机的世界里只认0和1,如果想描述一些文字的编码就需要对这些二进制的数据进行组合,所以才有了中文,在进行编码的时候如果想要正确显示出内容则一定需要有解码,所以编码和解码肯定要采用统一的变标准,不统一时就会出现乱码。

那么在开发之中常用的编码有如下几种:

  • GBK/gb2312:国标编码,可以描述中文信息,其中GB2312只描述简体中文,而GBK包含简体与繁体;
  • ISO8859-1:国际通用编码,可以用其描述所有字母信息,如果是象形文字则需要进行编码转换;
  • UBICODE编码:采用十六进制的方式存储,可以描述所有的文字信息;
  • UTF:象形文字使用十六进制编码,普通字母采用ISO8859-1通用编码,适合快速传输节约带宽,也就成为了开大首选的编码,主要使用“UTF-8”编码。

要想知道当前系统中支持的编码规则,则可以采用如下代码列出本机属性。

System.getProperties().list(System.out);

项目中出现的乱码就是编码与解码标准不统一,而最好的解决乱码的方式,所有的编码都用UTF-8。

猜你喜欢

转载自blog.csdn.net/weixin_46245201/article/details/112857142