Python3和Python2的几个区别

Unicode 是「字符集」 :字符的唯一标识

UTF-8 是「编码规则」:字符的存储方式

Python2中str是非unicode类型  [ ASCII ]

Python3中str为unicode类型

Python3中中bytes类型为非unicode类型,图片、视频、音频等二进制数据,都可以用 bytes 表示

Python2中bytes没有实际的意义

unicode为一个字符集,不是一种编码格式,unicode的具体编码格式为utf-8、utf-16和utf-32 ,其中utf-8和utf-16为可变长的编码格式,即字符最短存储字节为8位(utf-8)表示汉字时用三个字节表示一个汉字,unicode用两个字节表示一个汉字。

Python2中的str是非unicode的字符集,那是哪种字符集?

ASCII 码既可以说是字符集也可以说是编码,Python2的编码规则为ASCII

猜你喜欢

转载自blog.csdn.net/p571912102/article/details/80976895
今日推荐