ASCII，Unicode，UTF-8码介绍 - 代码天地

ASCII，Unicode，UTF-8码介绍

其他 2020-01-22 13:16:03 阅读次数: 0

ASCII码

ASCII 码一共规定了128个字符的编码，比如空格SPACE是32（二进制00100000），大写的字母A是65（二进制01000001）。这128个符号（包括32个不能打印出来的控制符号），只占用了一个字节的后面7位，最前面的一位统一规定为0。

Unicode

Unicode，就像它的名字表示的，这是一种所有符号的编码。
Unicode 当然是一个很大的集合，现在的规模可以容纳100多万个符号。每个符号的编码都不一样。

- - >> Unicode的问题

Unicode 只是一个符号集，它只规定了符号的二进制代码，却没有规定这个二进制代码应该如何存储。
第一个问题是，如何才能区别 Unicode 和 ASCII ？
第二个问题是，我们已经知道，英文字母只用一个字节表示就够了，如果 Unicode 统一规定，每个符号用三个或四个字节表示，那么每个英文字母前都必然有二到三个字节是0，这对于存储来说是极大的浪费，文本文件的大小会因此大出二三倍，这是无法接受的。
它们造成的结果是：

出现了 Unicode 的多种存储方式，也就是说有许多种不同的二进制格式，可以用来表示 Unicode。
Unicode 在很长一段时间内无法推广，直到互联网的出现。

UTF- 8

UTF-8 就是在互联网上使用最广的一种 Unicode 的实现方式。其他实现方式还包括 UTF-16（字符用两个字节或四个字节表示）和 UTF-32（字符用四个字节表示），不过在互联网上基本不用。这里的关系是，UTF-8 是 Unicode 的实现方式之一 。
UTF-8 最大的一个特点 : 它是一种变长的编码方式。它可以使用1~4个字节表示一个符号，根据不同的符号而变化字节长度。
UTF-8 的编码规则很简单 :

对于单字节的符号，字节的第一位设为0，后面7位为这个符号的 Unicode 码。因此对于英语字母，UTF-8 编码和 ASCII 码是相同的。
对于n字节的符号（n > 1），第一个字节的前n位都设为1，第n + 1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的 Unicode 码。

下表总结了编码规则，字母x表示可用编码的位。
在这里插入图片描述

Mr.OO

发布了58 篇原创文章 · 获赞 7 · 访问量 9242

私信关注

猜你喜欢

转载自blog.csdn.net/Mr_OO/article/details/102871066

ASCII，Unicode，UTF-8码介绍

ASCII码、Unicode码、UTF-8

Unicode，UTF-8，ASCII码的区别

python基础整理——ASCII码、Unicode、utf-8、gbk

ASCII，Unicode和UTF-8

ASCII、Unicode、UTF-8编码关系

ASCII、ANSI、Unicode及UTF-8编码

ascii、unicode、utf-8、gbk 区别

Unicode,UTF-8,ASCII等字符编码

ASCII,Unicode和UTF-8

理解：ASCII、Unicode、UTF-8

ASCII，Unicode 和 UTF-8

ASCII、Unicode与UTF-8的关系

ASCII Unicode UTF-8 之间的关系

ASCII, Unicode和UTF-8

ASCII、unicode和UTF-8的起源

ASCII，Unicode，UTF-8基础概念

ASCII、Unicode和UTF-8

编码格式ASCII、Unicode、UTF-8

ASCII，Unicode 和 UTF-8的区别

ASCII、Unicode、UTF-8编码

编码：ASCII 、UniCode、UTF-8

字符编码：ASCII Unicode UTF-8

ascii、unicode、utf-8、gbk编码

字符编码ASCII、Unicode、UTF-8

UTF-8，Unicode、ASCII和GBK

Unicode,ASCII,UTF-8的区别

编码：ASCII，Unicode 和 UTF-8

字符集详解 ASCII码、Unicode、UTF-8 （转）

三种编码：ASCII 码、Unicode 编码、UTF-8。（学习记录）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)