Python数据类型和字符编码

一、文字转二进制

1、把#Alex 按照ASCII表转成二进制形式

blob.png

2、计算机如何分清哪段代表#,哪段是代码A

blob.png


二、计算机容量单位

由于字符串长的长,短的短,难以分清每个字符的起止位置,既然ASCII一共是255个字符,那么最长的也不过是11111111八位,不如把所有二进制

转换成8位的,不足的用0来代替。

blob.png

每一位0或者1所占的空间单位为bit(比特),这是计算机中最小的表示单位

扫描二维码关注公众号,回复: 967726 查看本文章

blob.png


三、字符编码

为了解决每个国家不同编码间不互通的问题,ISO标准组织出马!


Unicode编码:国际标准字符集,他将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。Unicode(统一码、万国码)规定所有的字符和符号最少由16位来表示(2个字节),即2**16=65536;


UTF-8,是对Unicode编码的压缩和优化,他不在使用最少使用2个字节,而是将所有的字符和符号进行分类:asci码中的内容用1个字节、欧洲的字符用2个字节保存,东亚的字符用三个字节保存;


windows系统中文版默认的编码是GBK

Mac OS \ Linux 系统默认的编码是UTF8

Python 2.x默认编码是ASCII

Python 3.X默认编码是UTF-8

blob.png


猜你喜欢

转载自blog.51cto.com/13753625/2118703
今日推荐