ASCII、ANSI、Unicode及UTF-8编码 - 代码天地

ASCII、ANSI、Unicode及UTF-8编码

移动开发 2018-05-12 13:46:15 阅读次数: 0

ASCII和Ansi编码

字符内码：指的是用来代表字符的内码.读者在输入和存储文档时都要使用内码,

内码分为：

单字节内码 -- Single-Byte character sets (SBCS),可以支持256个字符编码.
双字节内码 -- Double-Byte character sets)(DBCS),可以支持65000个字符编码.
前者即为ASCII编码，后者对应ANSI.
至于简体中文编码GB2312，实际上它是ANSI的一个代码页936

Unicode

　ANSI有很多代码页，使用不同代码页的内码无法在其他代码也正常显示，这就是为什么日文版／繁体中文版游戏无法在简体中文平台直接显示的原因．
Unicode也是一种字符编码方法，不过它是由国际组织设计，可以容纳全世界所有语言文字的编码方案．它是一种２字节编码，能够提供65536个字符，这个数字是不够表示所有的字符的（汉语就有55000多字符），所以，通过一个代理对的机制来实现附加的917476个字符表示，以达到所有字符都具有唯一编码．

Unicode和BigEndianUnicode 区别

这两者只是存储顺序不同，如＂A＂的unicode编码为65 00 ，BigEndianUnicode编码为00 65

UTF-8

这是为传输而设计的编码，其系列还有UTF-7和UTF-16
其中UTF-16和Unicode编码大致一样, UTF-8就是以8位为单元对Unicode进行编码。从Unicode到UTF-8的编码方式如下：
　　　　　Unicode编码(16进制)　　　　　　UTF-8 字节流(二进制)
　　　　　0000 - 007F　　　　　　　　　0xxxxxxx
　　　　　0080 - 07FF　　　　　　　　　110xxxxx 10xxxxxx
　　　　　0800 - FFFF　　　　　　　　　1110xxxx 10xxxxxx 10xxxxxx

　　例如“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间，所以肯定要用3字节模板了：1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是：0110110001 001001，用这个比特流依次代替模板中的x，得到：11100110 10110001 10001001，即E6 B1 89。

猜你喜欢

转载自tiankefeng0520.iteye.com/blog/2025137

ASCII、ANSI、Unicode及UTF-8编码

ANSI、ASCII、Unicode和UTF-8编码

GBK、ANSI、Unicode、UTF-8编码

字符编码详解（ASCII,Unicode,ANSI,UTF-16,UTF-8）

概念浅析：字符集、字符编码、字节序、ASCII、GBK、Unicode、UTF-8、ANSI

字符编码：ANSI和ASCII区别、Unicode和UTF-8区别

各种编码UNICODE、UTF-8、ANSI、ASCII、GB2312、GBK详解

字符编码ANSI和ASCII区别、Unicode和UTF-8区别

各种编码UNICODE、UTF-8、ANSI、ASCII、GB2312、GBK详解（一）

各种编码UNICODE、UTF-8、ANSI、ASCII、GB2312、GBK详解（二）

ASCII、Unicode、UTF-8编码关系

Unicode,UTF-8,ASCII等字符编码

编码格式ASCII、Unicode、UTF-8

ASCII、Unicode、UTF-8编码

编码：ASCII 、UniCode、UTF-8

字符编码：ASCII Unicode UTF-8

ascii、unicode、utf-8、gbk编码

字符编码ASCII、Unicode、UTF-8

编码：ASCII，Unicode 和 UTF-8

unicode,ansi,utf-8,unicode big endian编码的区别

python中的字符串编码问题——2.理解ASCII码、ANSI码、Unicode编码、UTF-8编码

ASCII、Unicode、UTF-8、UTF-16、GBK、GB2312、ANSI等编码方式简析

Ansi,UTF8,Unicode,ASCII编码的区别

关于字符编码ANSI、UNICODE、UTF-8等

ANSI、UTF-8和Unicode编码区别

字符编码 ansi unicode utf-8 区别

UTF-8编码和Unicode，ASCII编码区别

字符编码——ASCII，Unicode和UTF-8编码

字符编码unicode，utf-8和ascii

【转】字符编码笔记：ASCII，Unicode 和 UTF-8

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)