Unicode 是「字符集」 :字符的唯一标识
UTF-8 是「编码规则」:字符的存储方式
Python2中str是非unicode类型 [ ASCII ]
Python3中str为unicode类型
Python3中中bytes类型为非unicode类型,图片、视频、音频等二进制数据,都可以用 bytes 表示
Python2中bytes没有实际的意义
unicode为一个字符集,不是一种编码格式,unicode的具体编码格式为utf-8、utf-16和utf-32 ,其中utf-8和utf-16为可变长的编码格式,即字符最短存储字节为8位(utf-8)表示汉字时用三个字节表示一个汉字,unicode用两个字节表示一个汉字。
Python2中的str是非unicode的字符集,那是哪种字符集?
ASCII 码既可以说是字符集也可以说是编码,Python2的编码规则为ASCII