版权声明:署名,允许他人基于本文进行创作,且必须基于与原先许可协议相同的许可协议分发本文 (Creative Commons)
1、编码种类
ASCII:只表示英文,8位表示信息,有28表示结果
Unicode(万国码):使用32位表示信息,有2的32次方的表示结果,目前只使用了21位。
UTF-8:浪费存储空间,对Unicode做压缩,以8个为单位,用尽量少的位数来表示信息。UTF-8中一个中文占用3个字节。
GBK:亚洲地区使用的编码,一个中文占两个字节
2、python解释器编码
python2解释器编码默认使用ASCII编码
python3解释器编码默认使用UTF-8编码
由于python2默认使用ascii编码,不支持中文,需要改变文件编码格式才能正常运行程序,需要在文件内容的头部指定编码格式:
# -*- coding:utf-8 -*-
3、文件编码
编写文件时,保存文件要用utf-8格式
以哪种编码格式保存,就要使用哪种编码格式打开
Mac和Linux中默认采用UTF-8编码