Java Unicode编码系统

Unicode是一种通用的国际标准字符编码,能够表示世界上大多数的书面语言。

为什么java使用Unicode系统?

在Unicode之前,有很多语言标准:
  • ASCII (美国信息交换标准代码)。
  • ISO 8859-1 用于表示西欧语言。
  • KOI-8 用于表示俄文。
  • GB18030 和 BIG-5 用于表示中文等等。

问题


  • 一般的编码乱码问题是由于编码代码值中对应的各标准语言中的字母不同。
  • 具有大字符集的语言的编码具有可变长度。一些常见字符被编码为单字节,其他需要两个或多个字节(中文等)。

Java中的解决办法


      为了解决这些问题,开发了一种新的语言标准,即Unicode系统。在unicode中,每个字符保存为2个字节,因此java也使用2个字节的字符。

  • 最小值: \u0000
  • 最高值: \uFFFF

但是现在随着字符的扩展,可能已经不够用了。

猜你喜欢

转载自blog.csdn.net/weixin_43101144/article/details/83893669