编码的进阶:
背景:
ASCII:英文字母,数字,特殊符号,------------>二进制的对应关系
str:
一个字符 --------------->一个字节
a:0001 0000
Unicode :万国码:世界上所有文字的
1个字符------------》4个字节
a:0001 00000001 00000001 00000001 0000
中:0001 00000001 00000001 00000001 0000
因为上面浪费
扫描二维码关注公众号,回复:
5461965 查看本文章
utf-8 : 至少使用一个
a:一位映射的ASCII
中:三位
gbk:国标
a:映射的ASCII
中:三位
1.不同的编码之间的0101011 是不能互相识别的
2.网络传输,数据存储到磁盘,--------------> 01010101二进制,不能使用unicod的编码本去编译
(Unicode) 四位 , 浪费的资源太多
大背景: python3X 版本
str:它在 内存中的编码方式:Unicode 涵盖所有的文字
但是 写入文件的内容,传输给别人的数据, 一般都是str的形式
矛盾点: 传输 和 使用 。
解决: 利用str 发送或者传输(转换,将unicodez转换成非U)----------->发送,传输
int
bytes 数据类型