关于gbk, gb2312,unicode,utf-8等字符编码的问题

对于字符编码,时间长了很容易搞混,这里不在阐述各个字符集的来龙去脉,仅记下结论:

  1. ascii : 8bit, 主要存放的是英⽂文, 数字, 特殊符号
  2. gb2312:16bit,简体字版中文
  3. gbk: 16bit, 主要存放中⽂文和亚洲字符. 兼容ascii和gb2312
  4. unicode: 16bit和32bit两个版本. 平时我们⽤用的是16bit这个版本. 全世界所有国家的⽂文 字信息. 缺点: 浪费空间(传输和存储)
  5. utf-8 : 可变⻓长度unicode, 英⽂文: 8bit, 欧洲⽂文字: 16bit, 中⽂文24bit. 一般数据传输和存储的时候使⽤

猜你喜欢

转载自blog.51cto.com/11110720/2478620