05-二进制与字符编码

05-二进制与字符编码


一:什么是字符编码

字符编码是一种规则或系统,用于将字符(包括字母、数字、符号和其他文本元素)映射到计算机内部表示的二进制数据。由于计算机只能理解和处理二进制数据,字符编码是将人类可读的字符转换为计算机能够处理的数字表示的桥梁。

在计算机中,每个字符都被表示为一个数字,这个数字对应一个特定的二进制码。不同的字符编码系统使用不同的映射规则,将字符映射为相应的数字。

二:常见的字符编码

二进制(0,1)
ASCII
GB2312
GBK
GB18030
Unicode几乎包含了全世界的字符
UTF-8
其他国家字符编码

注意:

UTF-8规定,英文用ASCII表表示,占一个字节,中文用三个字节表示

Unicode规定无论是中文还是英文,都用两个字节表示·

三:unicode与字符的相互转换

  1. chr()函数

    chr()函数接受一个整数作为参数,并返回对应的Unicode字符。

  2. ord()函数

    ord()函数接受一个字符(长度为1的字符串)作为参数,并返回该字符的Unicode码点。它将字符转换为对应的整数值。

演示:

print(chr(23435))
print(ord("宋"))

输出:

23435

猜你喜欢

转载自blog.csdn.net/qq_51248309/article/details/132860634
今日推荐