编码格式ASCII、Unicode、UTF-8

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yzy199391/article/details/89478086

ASCII编码

一个字节
字母A的ASCII编码为十进制的65,二进制的01000001

Unicode编码

世界上所有语言都统一到一套编码中,通常为两个字节。

字母A的ASCII编码为十进制的65,二进制的00000000 01000001(在ASCII编码基础上,在前面补8位0);

汉字,Unicode编码是十进制的20013,二进制的01001110 00101101

⚠️缺点:文本中的英文用Unicode编码比ASCII编码需多一倍多存储空间。

UTF-8编码

解决上述存储空间浪费的问题,为"可变长编码":将Unicode字符根据不同的数字大小编码成1~6个字节,常用的英文字母被编码成一个字节,汉字通常是3个字节,生僻字编码成4~6个字节
在这里插入图片描述

⚠️好处:ASCII编码是UTF-8编码的一部分,ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

计算机系统通用字符编码工作方式

计算机内存中,统一使用Unicode编码,传输或存储到硬盘时,为了节约空间,使用UTF-8编码。

  • 记事本编辑
    在这里插入图片描述

  • 浏览网页
    在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/yzy199391/article/details/89478086